El quark y el jaguar - Murray Gell-Mann

El quark y el jaguar

Murray Gell-Mann

Para Marcia

Es bueno para nosotros, el caos y el color, quiero decir.
Marcia Southwick, Why the River Disappears

Prefacio

El quark y el jaguar no es una autobiografía, aunque de hecho contiene recuerdos de mi infancia y anécdotas sobre colegas científicos. Tampoco trata de mi trabajo en el campo de los quarks, pese a que gran parte del libro está dedicada a reflexiones sobre las leyes fundamentales de la física, incluido el comportamiento de dichas partículas. Espero escribir algún día una autobiografía científica, pero el propósito en este volumen es presentar al lector mi propia visión sobre una síntesis que está emergiendo en los límites de la investigación acerca de la naturaleza del mundo que nos rodea: el estudio de lo simple y lo complejo. Este estudio está empezando a reunir, con una nueva perspectiva, material procedente de muy diversos campos de las ciencias físicas, biológicas y del comportamiento, e incluso de las artes y humanidades. El enfoque que conlleva facilita el descubrimiento de conexiones, en ocasiones entre hechos o ideas que a simple vista parecen muy alejados entre sí. Más aún, está empezando a dar respuesta a algunas de las preguntas que muchos de nosotros, científicos o no, continuamos haciéndonos sobre el verdadero significado de lo simple y lo complejo.

Este libro está dividido en cuatro partes. En la primera, comienzo refiriendo algunas experiencias personales que me condujeron a escribirlo. Dando largos paseos por las selvas tropicales, estudiando los pájaros y planeando actividades conservacionistas, comenzó a tomar cuerpo en mí la idea de compartir con los lectores mi creciente conciencia de los vínculos entre las leyes fundamentales de la física y el mundo que vemos a nuestro alrededor. Durante toda mi vida me ha apasionado explorar el reino de los seres vivos, aunque mi dedicación profesional ha estado principalmente orientada hacia la investigación de las leyes fundamentales. Estas leyes, subyacentes a toda ciencia (en un sentido que se discutirá en las páginas que siguen), a menudo parecen completamente ajenas a la experiencia, incluyendo gran parte de la propia de otras ciencias distintas de la física. Al reflexionar sobre cuestiones relacionadas con lo simple y lo complejo percibimos conexiones que nos permiten establecer vínculos entre todos los fenómenos de la naturaleza, desde los más sencillos a los más complicados.

Cuando mi esposa me leyó el poema de Arthur Sze donde menciona el quark y el jaguar, me chocó de inmediato lo bien que ambas imágenes se ajustaban a lo que yo quería tratar. Los quarks son los ladrillos básicos que componen toda la materia. Todo objeto que vemos está constituido de quarks y electrones. Incluso el jaguar, ese antiguo símbolo de fuerza y ferocidad, es un manojo de quarks y electrones, ¡pero qué manojo! Exhibe una enorme complejidad, resultado de miles de millones de años de evolución biológica. Sin embargo, ¿qué significa exactamente la complejidad en este contexto, y cómo surgió? Esta es la clase de cuestiones que este libro trata de responder.

El resto de la primera parte está dedicado a las relaciones entre conceptos diversos de simplicidad y complejidad, así como a los sistemas complejos adaptativos —aquellos que aprenden o evolucionan del mismo modo que lo hacen los seres vivos—. Un niño que aprende su lengua materna, una bacteria que desarrolla resistencia a los antibióticos y la empresa científica humana son ejemplos de sistema complejo adaptativo que se discuten. También se discute el papel de la teoría en la ciencia, así como el problema de cuáles son las ciencias más fundamentales, junto con la cuestión relacionada de lo que se entiende por reduccionismo.

La segunda parte trata de las leyes fundamentales de la física, aquellas que gobiernan el cosmos y las partículas elementales a partir de las cuales se compone toda la materia del universo. Aparecen aquí por derecho propio los quarks, así como las supercuerdas, que ofrecen por primera vez en la historia una seria posibilidad de teoría unificada de todas las partículas e interacciones de la naturaleza. La teoría de las partículas elementales es tan abstracta que mucha gente encuentra difícil seguirla incluso cuando, como aquí, se la explica sin recurrir a las matemáticas. Para algunos lectores quizá sea aconsejable saltarse estas secciones, especialmente los capítulos 11 (sobre la interpretación moderna de la mecánica cuántica) y 13 (sobre el modelo estándar de las partículas elementales, quarks incluidos). La no lectura de estos capítulos, o incluso de toda la segunda parte, no impide el seguimiento de las partes restantes. Resulta irónico que una parte del libro consagrada a explicar por qué las teorías físicas fundamentales son simples, pueda resultar, sin embargo, demasiado difícil para muchos lectores. ¡Mea culpa! Esta segunda parte concluye con un capítulo sobre la flecha o flechas del tiempo, y culmina con un comentario acerca de por qué siguen apareciendo más y más estructuras complejas, ya sean sistemas complejos adaptativos, como la evolución biológica, ya sean sistemas no adaptativos, como las galaxias.

La tercera parte recoge las presiones selectivas que actúan sobre los sistemas complejos adaptativos, especialmente en la evolución biológica, el pensamiento creativo humano, el pensamiento crítico y supersticioso y algunos aspectos (incluidos los económicos) del comportamiento de las sociedades humanas. Se introducen las nociones, imprecisas aunque convenientes, de adaptación y relieve adaptativo. En el capítulo 20 describo brevemente el uso de los ordenadores como sistemas complejos adaptativos, por ejemplo para desarrollar estrategias en ciertos juegos o para proporcionar simulaciones simplificadas de sistemas complejos adaptativos naturales.

La última parte difiere bastante del resto, pues se centra más en asuntos de política y legislación. El capítulo 21 prosigue la discusión precedente sobre la diversidad de la vida en la Tierra como representación de la información destilada a lo largo de cuatro mil millones de años de evolución biológica, así como la diversidad cultural del hombre representa lo mismo en relación con las decenas de miles de años de evolución cultural del Homo sapiens sapiens. En este capítulo argumento que merece la pena dedicar un gran esfuerzo a preservar tanto la diversidad biológica como la cultural, y señalo algunos de los desafíos, problemas y paradojas implicados. Pero no es posible considerar todos estos aspectos por separado. En la actualidad, la red de interrelaciones que conecta el género humano consigo mismo y con el resto de la biosfera es tan compleja que todos los aspectos se influyen mutuamente en grado extremo. Alguien debería estudiar el sistema en su totalidad, aunque sea toscamente, porque la suma de los estudios parciales de un sistema complejo no lineal no puede dar idea del comportamiento del todo. El capítulo 22 describe algunos de los esfuerzos que empiezan a desarrollarse para llevar a cabo un estudio tal de los problemas mundiales que incluya todos los aspectos relevantes, y no sólo los medioambientales, demográficos o económicos, sino también los sociales, políticos, militares, diplomáticos e ideológicos. El objeto de este estudio no es especular sobre el futuro, sino tratar de identificar, entre las múltiples alternativas de futuro razonablemente probables que se le plantean al género humano y al resto de la biosfera, cuáles son aquellas que podrían conducir a una mayor sostenibilidad. La palabra sostenibilidad se emplea aquí en un sentido amplio, que no sólo implica evitar las catástrofes medioambientales, sino también las guerras devastadoras, la propagación de las tiranías permanentes y otros males mayores.

El lector encontrará en este volumen muchas referencias al Instituto de Santa Fe, en cuya fundación colaboré y en el cual trabajo ahora después de retirarme del Instituto Tecnológico de California. En este último soy en la actualidad profesor emérito tras haber enseñado allí durante más de treinta y ocho años. Una buena parte de la investigación que hoy se lleva a cabo sobre la simplicidad, la complejidad y los sistemas complejos adaptativos la efectúan miembros del Instituto o, para ser más exactos, de la familia del Instituto.

Resulta apropiada la palabra familia, porque el Instituto de Santa Fe es una organización bastante poco rígida. El presidente, Edward Knapp, está asistido por dos vicepresidentes y una plantilla de personal administrativo compuesta por una docena de trabajadores de gran dedicación. Solamente hay tres catedráticos, yo entre ellos, todos con cinco años de antigüedad. Cualquiera puede ser visitante, con una estancia entre un día y un año. Los visitantes vienen de todas partes del mundo, algunos de ellos con cierta frecuencia. El Instituto organiza numerosos cursillos, que duran desde unos pocos días hasta semanas. Además, se han establecido varias redes de investigación sobre diversos temas interdisciplinarios. Los miembros de estas redes se comunican entre sí por teléfono, correo electrónico, fax y ocasionalmente por correo ordinario, y se reúnen periódicamente en Santa Fe o en otro lugar. Hay expertos en decenas de especialidades, todos interesados en colaborar por encima de las fronteras disciplinarias. Cada uno de ellos trabaja en su propia institución, donde lleva a cabo satisfactoriamente sus investigaciones, pero todos valoran su afiliación a Santa Fe porque les permite establecer contactos que de otra manera resultarían menos fáciles. Las instituciones de procedencia pueden ser grandes laboratorios industriales, universidades o laboratorios nacionales (especialmente el de Los Alamos, que ha suministrado al Instituto tantos miembros brillantes y activos).

Quienes se dedican a estudiar sistemas complejos adaptativos comienzan ya a encontrar algunos principios generales subyacentes en este tipo de sistemas; la búsqueda de estos principios requiere intensas discusiones y colaboraciones entre especialistas de muchas áreas. Por descontado, el estudio meticuloso e inspirado de cada especialidad sigue siendo tan vital como siempre, pero la integración de las diferentes especialidades es también una necesidad urgente. El puñado de expertos y científicos especialistas que se están convirtiendo en estudiosos de la simplicidad y la complejidad, o de los sistemas complejos adaptativos en general, ha realizado ya importantes contribuciones científicas.

El éxito de esta transición se halla asociado a menudo con cierto estilo de pensamiento. Nietzsche introdujo la distinción entre «apolíneos», aquéllos que dan preferencia a la lógica, la aproximación analítica y el peso desapasionado de la evidencia, y «dionisíacos», aquéllos más inclinados a la intuición, la síntesis y la pasión. Estos rasgos se suelen correlacionar de forma burda con el uso preferente de los hemisferios cerebrales izquierdo y derecho, respectivamente. Algunos de nosotros parecemos pertenecer a otra categoría: los «odiséicos», que combinan las dos predilecciones en su búsqueda de conexiones entre las ideas. La gente así suele sentirse sola en las instituciones convencionales, pero encuentran un ambiente particularmente agradable en el Instituto de Santa Fe.

Las especialidades representadas en el centro incluyen las matemáticas, la informática, la física, la química, la biología de poblaciones, la ecología, la biología evolutiva, la biología del desarrollo, la inmunología, la arqueología, la lingüística, las ciencias políticas, la economía y la historia. El Instituto también convoca seminarios y publica memorias científicas sobre temas tan dispares como la propagación de la epidemia del SIDA, las oleadas migratorias de los pueblos prehistóricos del sudoeste de los Estados Unidos, las estrategias de recolección de las colonias de hormigas, cómo se puede ganar dinero aprovechando aspectos no aleatorios de las fluctuaciones de precios en los mercados financieros, qué les sucede a las comunidades ecológicas cuando desaparecen especies importantes, cómo programar ordenadores para simular la evolución biológica y cómo gobierna la mecánica cuántica el mundo familiar que vemos a nuestro alrededor.

El Instituto de Santa Fe colabora también con otras organizaciones en el intento, descrito en el capítulo 22, de modelar las vías a través de las cuales la sociedad humana de nuestro planeta puede evolucionar hacia esquemas más sostenibles de interacción consigo misma y con el resto de la biosfera. Aquí resulta especialmente necesario superar la idea dominante en los círculos académicos y burocráticos de que sólo merece la pena dedicarse seriamente a investigaciones altamente detalladas en el seno de una especialidad. Hay que valorar las contribuciones igualmente fundamentales de aquellos que se atreven a dar lo que yo llamo «un vistazo a la totalidad».

Aunque el Instituto de Santa Fe es uno de los poquísimos centros científicos del mundo dedicados exclusivamente al estudio de lo simple y lo complejo en una gran variedad de campos, no es de ninguna manera el único lugar —ni siquiera el principal— donde se llevan a cabo investigaciones importantes sobre estos temas. Muchos de los proyectos específicos del Instituto tienen paralelos en otras partes del mundo y, en muchos casos, la investigación relevante comenzó anteriormente en otras instituciones, a menudo antes de que este centro fuera fundado en 1984. En algunos casos, esas instituciones son la base de operaciones de miembros clave de la familia del Instituto.

En este punto debería disculparme por lo que debe parecer una especie de campaña publicitaria, especialmente porque la naturaleza de la relación entre el Instituto y otras organizaciones científicas y docentes ha aparecido algo distorsionada en ciertos libros publicados por autores científicos en los últimos años. La glorificación del Santa Fe a expensas de otros lugares ha indignado a muchos de nuestros colegas, especialmente en Europa. Pido excusas por adelantado si mi libro diera una impresión igualmente equivocada. La única razón de mi insistencia en Santa Fe es que estoy familiarizado con buena parte del trabajo que se lleva a cabo aquí, o con el que realizan los estudiantes y científicos que nos visitan, y conozco más bien poco de la investigación que se desarrolla en otros lugares.

En cualquier caso, citaré (sin ningún orden particular) algunas de las instituciones punteras donde se realizan, o se han estado realizando durante muchos años, investigaciones relevantes sobre aspectos relacionados con la simplicidad, la complejidad y los sistemas complejos adaptativos. Naturalmente, al hacer esto corro el riesgo de exacerbar la ira de los científicos y estudiosos pertenecientes a los centros que no he incluido en esta lista parcial: La École Nórmale Superieure de París; el Instituto Max Planck de Química Biofísica en Göttingen, cuyo director es Manfred Eigen; el Instituto de Química Teórica de Viena, antes dirigido por Peter Schuster, actualmente embarcado en la fundación de un nuevo instituto en Jena; la Universidad de Michigan, donde Arthur Burks, Robert Axelrod, Michael Cohen y John Holland forman el «grupo BACH», un equipo interdisciplinario que durante mucho tiempo ha trabajado en problemas relacionados con sistemas complejos, todos ellos conectados en algún grado con el Instituto de Santa Fe, especialmente John Holland, miembro, al igual que yo, del consejo científico; la Universidad de Stuttgart, donde Hermann Haken y sus colaboradores se dedican desde hace tiempo al estudio de los sistemas complejos en las ciencias físicas bajo la denominación de «sinergética»; la Universidad Libre de Bruselas, donde se han llevado a cabo importantes aportaciones durante muchos años; la Universidad de Utrech; el Departamento de Ciencias Puras y Aplicadas de la Universidad de Tokio; el ATR, cerca de Kyoto, adonde se ha ido Thomas Ray, antes en la Universidad de Delaware; los centros para el estudio de sistemas no lineales en varios campus de la Universidad de California, entre ellos los de Santa Cruz, Berkeley y Davis; la Universidad de Arizona; el Centro para la Investigación de Sistemas Complejos, del Instituto Beckman, adscrito a la Universidad de Illinois en Urbana; el programa de computación y redes neuronales del Instituto Beckman, adscrito al Instituto Tecnológico de California; la Universidad Chalmers, en Goteburgo; el NORDITA, en Copenhague; el Instituto Internacional para el Análisis Aplicado de Sistemas, en Viena, y el Instituto para el Intercambio Científico, en Turín.

Algunos amigos y colegas, cuyo trabajo respeto profundamente, han tenido la amabilidad de revisar todo el manuscrito en varias fases de su elaboración. Estoy muy agradecido por su ayuda, que me ha resultado inmensamente valiosa, aunque, debido a las premuras de tiempo, sólo he podido aprovechar una fracción de sus excelentes sugerencias. Ellos son Charles Bennet, John Casti, George Johnson, Rick Lipkin, Seth Lloyd, Cornac McCarthy, Harold Morowitz y Cari Sagan. Además, un puñado de distinguidos expertos en diversos campos me ha regalado su tiempo accediendo a revisar pasajes particulares del manuscrito; quiero mencionar a Brian Arthur, James Brown, James Crutchfield, Marcus Feldman, John Fitzpatrick, Walter Gilbert, James Hartle, Joseph Kirschvink, Christopher Langton, Benoit Mandelbrot, Charles A. Munn III, Thomas Ray, J. William Schopf, John Schwarz y Roger Shepard. Naturalmente, los errores que puedan persistir son de mi única responsabilidad, y no son atribuibles a ninguna de estas personas sabias y amables.

Cualquiera que me conozca sabe de mi aversión a los errores, que se manifiesta, por ejemplo, en mi incesante corrección de palabras francesas, italianas y españolas en los menús de los restaurantes americanos. Cuando descubro una inexactitud en un libro escrito por cualquier otro, me invade la decepción y me pregunto si en verdad podré aprender algo de un autor que ha demostrado estar equivocado como mínimo en un punto. Cuando los errores me conciernen a mí o a mi trabajo, me pongo furioso. Así pues, el lector de este volumen se podrá hacer fácilmente una idea de la turbación que estoy padeciendo al imaginarme decenas de errores graves descubiertos por mis amigos y colegas tras la publicación, y señalados, con soma o pena, a este autor tan perfeccionista. Además, no dejo de pensar en el personaje imaginario que me describió Robert Fox (un autor especializado en el problema de la población): un vigilante de faro noruego que no tenía otra cosa que hacer en las largas noches de invierno que leer nuestros libros en busca de errores.

Quisiera expresar mi especial gratitud a mi diestra y fiel asistente, Diane Lams, por toda la ayuda que me ha prestado en el proceso de acabado y edición del libro, por resolver mis asuntos de forma tan competente, lo que me permitió dedicar el suficiente tiempo y energía al proyecto y, en especial, por sobrellevar el mal carácter que muestro frecuentemente a la vista de plazos límite.

Los editores, W.H. Freeman and Company, han sido muy comprensivos con mis dificultades a la hora de cumplir plazos, y me proporcionaron un maravilloso jefe de edición, Jerry Lyons (ahora en Springer-Verlag), con quien ha sido una delicia trabajar. Quisiera agradecerle no sólo sus esfuerzos, sino también su buen humor y afabilidad, y los muy buenos momentos que Marcia y yo hemos pasado con él y su maravillosa esposa, Lucky. Mi gratitud se extiende también a Sara Yoo, quien trabajó incansablemente distribuyendo copias y revisiones a editores impacientes de todo el mundo. Liesl Gibson merece mi agradecimiento por su cortés y muy eficiente asistencia con las exigencias de última hora en la preparación del manuscrito.

Es un placer reconocer la hospitalidad de las cuatro instituciones a las que he estado ligado mientras escribía este libro: Caltech[1], el Instituto de Santa Fe, el Centro Aspen de Física y el Laboratorio Nacional de Los Alamos. Quisiera mostrar mi agradecimiento a la Fundación Alfred P. Sloan y a las agencias gubernamentales estadounidenses que han financiado mi investigación en los últimos años: el Departamento de Energía y la Oficina de Investigación Científica de la Fuerza Aérea. (A algunos lectores les puede sorprender el hecho de que estas agencias financien investigaciones que, como la mía, no están clasificadas como militares ni tienen conexión con las armas. La ayuda otorgada a la ciencia pura por estas organizaciones es una buena prueba de su clarividencia.) También agradezco profundamente la donación de Jeffrey Epstein al Instituto de Santa Fe para apoyar mi trabajo.

En Los Alamos me trataron muy amablemente el director del laboratorio. Sig Hecker, el director de la división teórica, Richard Slansky, y el secretario de la división. Stevie Wilds. En el Instituto de Santa Fe, cada miembro de la administración y del personal ha sido de lo más servicial. En Caltech, el presidente, el rector y los miembros entrantes y salientes de la división de física, matemáticas y astronomía, han sido todos ellos muy amables, así como John Schwarz y esa maravillosa dama que ha sido la secretaria del grupo de teoría de partículas elementales durante más de veinte años. Hclen Tuck. En el Centro Aspen de Física todo ha orbitado desde su fundación hace más de treinta años en torno a Sally Mencimer, y quisiera agradecerle también a ella sus muchas amabilidades.

Escribir nunca me ha resultado fácil, probablemente debido a que siendo niño mi padre criticaba con vehemencia cualquier cosa que yo redactase. El que yo fuese capaz de completar este proyecto hay que debérselo a mi amada esposa Marcia, que me inspiró y espoleó para perseverar en el trabajo. Su contribución fue indispensable también en otros aspectos. Como poetisa y profesora de inglés, fue capaz de curar mis peores hábitos lingüísticos, aunque desafortunadamente aún restan muchas imperfecciones de estilo que por supuesto, no hay que achacarle. Me persuadió para trabajar con un ordenador, del cual me he convertido en un adicto: ahora me parece extraño haber pensado alguna vez en pasar sin uno. Además, tratándose ella de una persona con poco bagaje científico o matemático, pero con un profundo interés en ambas disciplinas, ha sido el banco de pruebas ideal para este libro.

En mi labor de profesor y conferenciante, a menudo me han aconsejado elegir a alguien de la audiencia y dirigir la charla a esa persona en particular, tratando incluso de establecer contacto visual repetido con ella. En cierto sentido, eso es lo que he hecho aquí. Este libro está destinado a Marcia que me indicó incansablemente los sitios donde las explicaciones eran insuficientes o las discusiones excesivamente abstractas. He cambiado partes del manuscrito una y otra vez hasta que ella las comprendió y dio el visto bueno. Como en muchos otros aspectos, disponer de más tiempo me hubiera ayudado. Todavía hay, lamentablemente, ciertos pasajes en los que ella hubiese deseado una mayor claridad.

Mientras daba los toques finales que me permitían los plazos límite, me di cuenta de que nunca en mi vida había trabajado tan intensamente. La investigación en física teórica es completamente distinta. Naturalmente, un físico teórico piensa y ejerce muchísimo en horas intempestivas, sea o no consciente de ello. Pero unas pocas horas de reflexión o de cálculo, cada día o cada pocos días, más una buena cantidad de discusiones con colegas y estudiantes, junto con el tiempo dedicado al trabajo explícito en el escritorio o en la pizarra, suelen ser suficientes. Escribir, por contra, significa invertir un buen número de horas frente al teclado prácticamente cada día. Para una persona fundamentalmente perezosa como yo, ello ha representado una auténtica conmoción.

Lo más apasionante de haber escrito un libro como éste es la conciencia de que el propio proyecto era en sí mismo un sistema complejo adaptativo. En cada fase de su composición, tenía un modelo mental (o esquema) para el conjunto, un resumen conciso de lo que pretendía ser. Para producir un capítulo o una parte, este resumen tenía que revestirse de gran cantidad de detalles. Después, mi editor, mis amigos y colegas, y finalmente Marcia y yo mismo, examinábamos lo escrito, y los comentarios y críticas resultantes no sólo afectaban al texto de aquel capítulo, sino al propio modelo mental, propiciando a veces su sustitución por otro. Cuando se añadían detalles al nuevo modelo para producir más texto, se repetía el mismo proceso. De esta manera el concepto de la totalidad del trabajo continuaba evolucionando.

El resultado de este proceso evolutivo es el libro que el lector está a punto de leer. Espero que consiga comunicar algunas de las emociones que experimentamos los que nos dedicamos a pensar en la cadena de relaciones que enlazan el quark con el jaguar y con los propios seres humanos.

Parte I
Lo simple y lo complejo

Prólogo
Un encuentro en la jungla

En primer lugar, tengo que decir que nunca he visto un jaguar en libertad. Después de mucho caminar por las selvas tropicales y navegar por los ríos de América Central y del Sur, nunca he vivido la emocionante experiencia de encontrarme de repente ante el enorme y poderoso felino moteado. No obstante, algunos de mis amigos me han contado cómo el encuentro con un jaguar puede hacerle cambiar a uno la manera de ver del mundo.

Lo más cerca que he estado de conseguirlo fue en las selvas de las tierras bajas orientales del Ecuador, cerca del río Ñapo, un afluente del Amazonas, en el año 1985. En esta región se han asentado indios montañeses de habla quechua, la lengua del antiguo imperio inca. Aquí han aclarado pequeñas parcelas en medio de la jungla donde practican la agricultura y han bautizado con sus propios nombres algunos de los accidentes naturales del relieve amazónico.

Sobrevolando estas tierras, que se extienden miles de kilómetros en todas las direcciones, los ríos parecen bandas sinuosas serpenteando por la selva. A menudo los meandros se separan paulatinamente de la corriente principal originando lo que los geólogos llaman meandros abandonados, lagunas cuya única conexión con la corriente principal es un delgado hilo de agua. Los hispanohablantes de la región las llaman cochas, término quechua que se aplica también a los lagos elevados y al mar. Desde el aire pueden observarse todos los estadios del proceso: los meandros originales, las cochas recientes y, por último, la lenta desecación de las mismas, reclamadas para el bosque por una secuencia de especies vegetales que constituye una auténtica «sucesión ecológica». Finalmente se ven desde el aire como manchas de color verde claro sobre el verde más oscuro de la selva circundante, manchas que, al cabo de uno o varios siglos, acaban difuminándose.

El día que estuve a punto de ver un jaguar me encontraba en un sendero cerca de Paña Cocha, que significa «lago de las pirañas». En este lugar mis compañeros y yo habíamos pescado y cocinado otras veces pirañas de hasta tres especies, todas ellas exquisitas. Estos peces no son tan peligrosos como suele creerse. Es cierto que a veces atacan a la gente y que, si un bañista resulta mordido por alguno de ellos, es mejor que abandone el agua para que la sangre no atraiga a otros. Pero la verdad es que, cuando tropiezan con nosotros, lo más probable es que sean ellos los que acaben siendo devorados.

A una hora de camino del lago ahuyentamos un grupo de pecarís y, de inmediato, percibimos la presencia de otro gran mamífero ante nosotros. Había un intenso olor acre, muy diferente del de los cerdos salvajes, y se oían los crujidos de una criatura grande y pesada atravesando la maleza. Apenas pude entrever la punta de la cola antes de que desapareciera. El rey de los animales, el emblema del poder de sumos sacerdotes y gobernantes, había pasado de largo.

Pero no sería un jaguar, sino otro felino más pequeño, el que iba a tener una importancia vital para mí al hacerme ver hasta qué punto muchos de mis intereses en apariencia inconexos estaban en realidad ligados. Ocurrió cuatro años después del incidente en Ecuador, mientras me hallaba realizando estudios de campo sobre la flora y la fauna en otra área selvática de la América tropical, lejos de los antiguos dominios de los incas. En aquella región había florecido en el pasado otra gran civilización precolombina: la de los mayas. Me encontraba al noroeste de Belice, cerca de las fronteras guatemalteca y mejicana, en un lugar llamado Chan Chich, que significa «pequeño pájaro» en el dialecto maya local.

Todavía hoy se habla la lengua maya en esta parte de Centroamérica, y pueden encontrarse por doquier huellas de la civilización maya clásica, las más notables de las cuales son las ruinas de ciudades abandonadas. Una de las mayores es Tikal, con sus gigantescas pirámides y templos, situada en el extremo nororiental de Guatemala, a poco más de cien kilómetros de Chan Chich.

Las especulaciones sobre el derrumbamiento de la civilización maya, ocurrido hace más de mil años, son abundantes, pero las auténticas causas constituyen todavía hoy un misterio y una fuente de controversias. ¿Se cansó el pueblo llano de trabajar en beneficio de nobles y gobernantes? ¿Perdieron la fe en el elaborado sistema religioso que sostenía a la élite en el poder y mantenía intacto el entramado social? ¿Les llevaron a la catástrofe las guerras intestinas entre las múltiples ciudades-Estado? ¿Fracasaron finalmente las notables técnicas agrícolas que mantenían a tan vastas poblaciones en plena selva? Los arqueólogos continúan buscando respuesta a éstas y otras preguntas, considerando al mismo tiempo la relación entre el hundimiento definitivo de la civilización clásica en la selva y lo sucedido en las regiones más áridas del Yucatán, donde la civilización clásica dio paso a la civilización postclásica, de influencia tolteca.

Naturalmente, la visita a unas excavaciones tan imponentes como las de Tikal es inolvidable, pero la jungla brinda otros placeres a aquellos que ansían explorar terrenos menos conocidos. Uno de ellos es el descubrimiento inesperado de alguna de las muchas ruinas no señaladas en los mapas.

En la distancia, las ruinas parecen montículos cubiertos de árboles y arbustos en medio de la jungla, pero al mirar más de cerca se adivinan las antiguas construcciones cubiertas de musgo, helechos y enredaderas. Escudriñando entre el follaje uno puede hacerse idea de la forma y dimensiones del lugar, especialmente desde un punto elevado. Desde allí, por un instante, puede uno aclarar con la imaginación la selva y restaurar un pequeño enclave maya en todo su esplendor.

La selva que rodea Chan Chich no sólo es rica en restos arqueológicos, sino también en fauna. Uno puede contemplar tapires adultos irguiendo su corta trompa mientras vigilan a sus pequeñas crías de pelaje manchado, y admirar el brillante plumaje del pavo ocelado, especialmente el de los machos, con su llamativa cabeza azul cubierta de pequeñas verrugas rojas. Por la noche, dirigiendo una linterna a lo alto de los árboles, se pueden descubrir kinkajúes de grandes ojos agarrados a las ramas con sus colas prensiles.

Toda mi vida he sido un apasionado de la ornitología, y me resulta especialmente placentero registrar las voces de los pájaros ocultos en la selva y reproducir sus cantos o llamadas para atraerlos y observarlos de cerca (aparte de grabarlos mejor). Un día de finales de diciembre me hallaba paseando en busca de pájaros por un sendero solitario cerca de Chan Chich.

En un principio mi paseo resultó infructuoso. No pude ver ni grabar ninguna de las aves que buscaba y, tras más de una hora de camino, ya no prestaba atención a los cantos de los pájaros ni a los movimientos en el follaje. Mis pensamientos habían derivado hacia la disciplina que ha ocupado buena parte de mi v ida profesional: la mecánica cuántica.

Durante la mayor parte de mi carrera como físico teórico mis investigaciones han versado sobre partículas elementales, las piezas básicas que constituyen toda la materia del universo. A diferencia de los físicos de partículas experimentales, no tengo necesidad de tener al lado un gigantesco acelerador o un laboratorio subterráneo para llevar a cabo mi trabajo. No hago un uso directo de complejos detectores y no requiero, por tanto, de la colaboración de un gran equipo de profesionales. Como mucho necesito lápiz, papel y una papelera, y muchas veces ni siquiera eso. Dadme un sueño reparador, un entorno sin distracciones y liberadme por un tiempo de preocupaciones y obligaciones y podré trabajar. Ya sea en la ducha, o en un vuelo nocturno, suspendido en la penumbra entre la vigilia y el sueño, o paseando por un sendero solitario, mi trabajo puede acompañarme dondequiera que vaya.

La mecánica cuántica no es en sí misma una teoría; es más bien el marco en el que debe encajar toda teoría física moderna. Este marco, como es bien sabido, implica el abandono del determinismo que caracterizaba a la física «clásica», dado que la mecánica cuántica sólo permite, por principio, el cálculo de probabilidades. Los físicos saben cómo emplearla para predecir las probabilidades de los resultados posibles de un experimento, y desde su descubrimiento en 1924 siempre ha funcionado a la perfección dentro de los límites de la teoría y el experimento considerados en cada caso. Sin embargo, pese a que su exactitud está fuera de toda duda, aún no comprendemos en profundidad su significado, especialmente cuando se aplica a la totalidad del universo. Durante más de treinta años, unos cuantos físicos teóricos hemos intentado elaborar lo que yo llamo «la interpretación moderna» de la mecánica cuántica, que permite aplicar esta disciplina al universo y tratar también con sucesos particulares que impliquen objetos individuales, en lugar de restringirse a experimentos repetibles sobre porciones de materia fácilmente reproducibles. Mientras caminaba por la selva cerca de Chan Chich, meditaba sobre el modo en que la mecánica cuántica puede emplearse, en principio, para tratar con la individualidad, para describir qué pieza de fruta se comerán los loros o las diversas formas en que un árbol en crecimiento puede hacer añicos las piedras de un templo en ruinas.

El hilo de mis pensamientos se rompió cuando, a unos cien metros de distancia, apareció ante mí una figura oscura. Me detuve y levanté lentamente mis binoculares para verla con más detalle. Resultó ser un jaguarondi, un felino de tamaño medio. Estaba parado en medio del camino, de perfil y con la cabeza vuelta hacia mí, lo que me permitió observar el característico cráneo aplastado, el cuerpo alargado y las cortas patas delanteras —rasgos que le han valido también el nombre de «gato nutria»—. Su longitud, aproximadamente un metro, y el color del pelaje —un gris oscuro uniforme, casi negro— indicaban que se trataba de un ejemplar adulto de la variedad oscura (hay otra variedad rojiza). Imagino que llevaba allí un buen rato, con sus ojos parduscos fijos en mí mientras yo, absorto en los misterios de la mecánica cuántica, me acercaba a él. Aunque es de suponer que estaba preparado para huir ante el menor peligro, el animal parecía completamente tranquilo. Nos observamos mutuamente, inmóviles los dos, durante lo que me parecieron varios minutos. No se movió ni siquiera cuando me aproximé a sólo unos treinta metros de distancia. Luego, satisfecha su curiosidad sobre mi persona, el felino volvió la mirada hacia la jungla, bajó la cabeza y desapareció lentamente entre los árboles.

Una visión como ésta es poco frecuente. El jaguarondi es un animal tímido y, debido a la destrucción de sus hábitats naturales en México, Centroamérica y América del Sur, su número ha decrecido en los últimos años; en la actualidad figura en la Lista roja de animales amenazados. Por otra parte, esta criatura es, por lo visto, incapaz de reproducirse en cautividad. Mi experiencia con aquel jaguarondi en particular entró en resonancia con mis ideas sobre la noción de individualidad, y me hizo recordar otro encuentro anterior en la naturaleza.

Un día de 1956, siendo un muy joven profesor en Caltech, mi primera esposa Margaret y yo, casados hacía muy poco, viajábamos en nuestro descapotable de regreso a Pasadena desde la Universidad de California en Berkeley, donde yo había impartido algunos seminarios de física teórica. En aquellos días los profesores universitarios vestíamos de modo un poco más formal que ahora —yo llevaba un traje de franela gris y Margaret una falda y un suéter, con medias y zapatos de tacón alto—. Circulábamos por la carretera 99 (que aún no se había convertido en autopista) a la altura de Tejón Pass, entre Bakersfíeld y Los Angeles. Siempre que pasábamos por aquella zona yo solía mirar al cielo con la esperanza de ver un cóndor de California. Esta vez divisé una silueta de gran tamaño volando a baja altura sobre nosotros, que desapareció rápidamente tras una colina situada a nuestra derecha. Como no estaba seguro de lo que era, resolví averiguarlo. Aparqué rápidamente al lado de la carretera, cogí mis prismáticos, salí del coche y trepé por la colina, hundiéndome a cada paso en la gruesa capa de fango rojo que cubría la mayor parte del sendero. A mitad de camino miré atrás y vi a Margaret no lejos de mí, con su elegante atuendo tan cubierto de barro como el mío. Alcanzamos juntos la cima y, al mirar hacia abajo, vimos un terreno en el que yacía un ternero muerto. Sobre él, en pleno festín, había once cóndores de California, casi la totalidad de la población de la especie en aquella época. Estuvimos observando un buen rato cómo comían, volaban un poco, se posaban de nuevo, paseaban alrededor del cadáver y volvían a comer. Yo ya sabía de su enorme tamaño (unos tres metros de envergadura), su cabeza pelada brillantemente coloreada y su plumaje blanco y negro. Lo que me llamó la atención fue el hecho de que se podían distinguir unos de otros por las plumas que les faltaban. Uno había perdido un par de plumas remeras del ala izquierda, otro tenía una muesca en forma de cuña en la cola, y ninguno tenía el plumaje intacto del todo. El efecto era bastante chocante: cada ave era de hecho un individuo fácilmente identificable, siendo sus señas de identidad el resultado directo de accidentes históricos. Me pregunté si aquellas pérdidas de plumaje eran permanentes, consecuencia de una vida larga y azarosa, o temporales, resultado simplemente de la muda anual (más tarde supe que los cóndores renuevan por completo su plumaje cada año). Aunque estamos acostumbrados a pensar en los seres humanos (y en nuestro perro o nuestro gato) como individuos, la visión de aquellos cóndores fácilmente reconocibles reforzó poderosamente mi apreciación de hasta qué punto percibimos el mundo como compuesto de objetos individuales, animados o no, cada uno con su historia particular.

Treinta años más tarde, en la selva centroamericana, contemplando el lugar por donde había desaparecido el jaguarondi, mientras rememoraba los desaliñados cóndores y recordaba que justo antes había estado meditando sobre historia e individualidad en mecánica cuántica, comprendí de repente que mis dos mundos, el de la física fundamental y el de los cóndores, los jaguarondis y las ruinas mayas, se habían unido al fin.

He vivido durante décadas entre dos pasiones intelectuales, por una parte mi labor profesional, en la que trato de comprender las leyes universales que gobiernan los constituyentes últimos de toda la materia, y por otra parte mi vocación de estudiante aficionado de la evolución de la vida y la cultura humana. Siempre tuve la impresión de que, de alguna forma, ambas pasiones estaban íntimamente ligadas, pero durante mucho tiempo fui incapaz de descubrir cómo (a excepción del tema común de la belleza de la naturaleza).

Parece que haya un enorme vacío entre la física fundamental y mis otros pasatiempos. En la física de partículas elementales tratamos con entes como los fotones y los electrones, cada uno de los cuales se comporta exactamente de la misma forma dondequiera que estén en el universo. De hecho, todos los electrones son rigurosamente intercambiables, igual que los fotones. Las partículas elementales no tienen individualidad.

Suele pensarse que las leyes de la física de partículas son exactas, universales e inmutables (dejando de lado posibles consideraciones cosmológicas), a pesar de que los físicos las abordamos a través de aproximaciones sucesivas. Por contra, disciplinas tales como la arqueología, la lingüística y la historia natural se ocupan de imperios, lenguajes y especies individuales, y en una escala más reducida, de artefactos, palabras y organismos individuales, incluyendo los propios seres humanos. En estas disciplinas las leyes son aproximadas, y tratan de la historia y de la evolución que experimentan las especies biológicas, los lenguajes humanos o las culturas.

Ahora bien, las leyes mecanocuánticas fundamentales de la física ciertamente dan lugar a la individualidad. La evolución física del universo, regida por dichas leyes, ha producido objetos particulares diseminados por todo el cosmos, como nuestro propio planeta, y después, a través de procesos como la evolución biológica en la Tierra, las mismas leyes han dado lugar a objetos particulares como el jaguarondi y los cóndores, capaces de adaptarse y aprender, y, por último, objetos particulares como los seres humanos, capaces de desarrollar el lenguaje y la civilización y de descubrir esas mismas leyes físicas fundamentales.

Durante algunos años mi trabajo estuvo dedicado a esta cadena de relaciones tanto como a las propias leyes fundamentales. Estuve pensando, por ejemplo, en la distinción entre los sistemas complejos adaptativos, que experimentan procesos como el aprendizaje y la evolución biológica, y los sistemas que, como las galaxias o las estrellas, experimentan otros tipos de evolución no adaptativa. Algunos ejemplos de sistemas complejos adaptativos pueden ser un niño aprendiendo su lengua materna, una cepa de bacterias volviéndose resistente a un determinado antibiótico, la comunidad científica comprobando la validez de una nueva teoría, un artista desarrollando su creatividad, una sociedad adoptando nuevas costumbres o nuevas supersticiones, un ordenador programado para elaborar nuevas estrategias para ganar al ajedrez o el género humano, buscando nuevas maneras de vivir en mayor armonía consigo mismo y con el resto de organismos con los que comparte el planeta.

La investigación de estos sistemas y de sus propiedades comunes, así como el trabajo sobre la interpretación moderna de la mecánica cuántica y sobre el significado de la simplicidad y la complejidad, había experimentado notables progresos. Para favorecer el estudio interdisciplinario de estas materias, yo mismo había colaborado en la fundación del Instituto de Santa Fe en Nuevo México.

Mi encuentro con el jaguarondi en Belice reforzó mi conciencia de los progresos que mis colegas y yo habíamos hecho en la mejor comprensión de las relaciones entre lo simple y lo complejo, entre lo universal y lo individual, entre las leyes básicas de la naturaleza y los asuntos individuales y mundanos que siempre me habían atraído.

Cuanto más aprendía acerca del carácter de esas relaciones, con más vehemencia deseaba comunicárselo a otros. Por primera vez en mi vida, sentí la necesidad de escribir un libro.

Capítulo 2
Luz temprana

El título de este libro está inspirado en un poema de mi amigo Arthur Sze, un espléndido poeta chinoamericano que vive en Santa Fe y que conocí a través de su esposa Ramona Sakiestewa, una tejedora hopi de gran talento. Como lo expresa él, «el mundo del quark lo tiene todo para dar cuenta de un jaguar caminando en círculo en la noche».

Los quarks son las partículas elementales que constituyen el núcleo atómico. Soy uno de los dos teóricos que predijo su existencia, y fui yo quien les puso nombre. En el título, el quark simboliza las leyes físicas básicas y simples que gobiernan el universo y toda la materia que éste contiene. Sé que para mucha gente el calificativo de «simple» no es precisamente el que mejor define la física contemporánea, pero explicar cómo debe entenderse esta simplicidad es uno de los objetivos de este libro.

El jaguar representa la complejidad del mundo que nos rodea, especialmente tal como se manifiesta en los sistemas complejos adaptativos. La imagen de Arthur del quark y el jaguar transmite perfectamente mi idea de lo simple y lo complejo: de un lado, las leyes físicas subyacentes de la materia y el universo, y del otro, el rico entramado del mundo que percibimos directamente y del que formamos parte. Así como el quark es un símbolo de las leyes físicas que, una vez descubiertas, aparecen diáfanas ante el ojo analítico de la mente, el jaguar es, al menos para mí, una metáfora de los esquivos sistemas complejos adaptativos que continúan eludiendo una visión analítica clara, aunque su olor acre puede sentirse en la espesura. Ahora bien, ¿cómo surgió en mi niñez la fascinación por disciplinas como la historia natural, y cómo y por qué decidí finalmente hacerme físico?

Un niño curioso

Una gran parte de mi formación temprana se la debo a mi hermano Ben, nueve años mayor que yo. Fue él quien, cuando yo tenía tres años, me enseñó a leer (en la tapa de una caja de galletas) y me inició en la observación de aves y mamíferos, la botánica y el coleccionismo de insectos. Vivíamos en Nueva York, la mayor parte del año en Manhattan, pero incluso allí podía observarse la naturaleza. Pasábamos mucho tiempo en un bosquecillo de coníferas justo al norte del zoo del Bronx, lo poco que quedaba de un antiguo bosque que en el pasado debía abarcar toda el área urbana. Fragmentos de otros hábitats pervivían en lugares como las lagunas de Van Cortland Park, la playa y marismas de New Dorp, en Staten Island, e incluso Central Park, al lado de casa, donde podían verse algunas aves interesantes, especialmente durante las migraciones de primavera y otoño.

En estos lugares pude experimentar la diversidad de la naturaleza y el modo fascinante en que ésta se organiza. Si uno camina por la orilla de un pantano y ve un gorjeador o escucha su canto, sabe que lo más probable es que descubra otro poco después. Si uno desentierra un fósil, es probable que tropiece con otro parecido en las proximidades. Siendo ya físico me devanaba los sesos intentando averiguar el papel de las leyes físicas fundamentales en tales situaciones. La respuesta tiene que ver con el papel de la historia en la mecánica cuántica, y la explicación última reside en el estado primigenio del universo. Pero, dejando aparte cuestiones físicas tan profundas, el tema, menos abstruso, de la especiación como fenómeno biológico merece una consideración aparte.

La existencia de cosas tales como las especies no es en absoluto trivial. No son, como se ha dicho a veces, artefactos de la mente del biólogo. El gran ornitólogo y biogeógrafo Ernst Mayr suele contar cómo, al principio de su carrera, identificó ciento veintisiete especies entre las aves que nidificaban en un valle de Nueva Guinea. Los nativos del lugar distinguían ciento veintiséis; la única discrepancia era que ellos no diferenciaban entre dos especies del género Gerygone, muy similares, que Ernst sí podía discernir gracias a su adiestramiento como naturalista. Pero más importante todavía que el grado de concordancia entre gentes de distinta procedencia es el hecho de que las mismas aves pueden decirnos si pertenecen o no a la misma especie. Los animales de especies distintas no suelen aparearse entre sí y, en los raros casos en que esto sucede, los híbridos que resultan suelen ser estériles. De hecho, una de las mejores definiciones de especie es aquélla que establece que entre miembros de especies diferentes no existe, por los medios ordinarios, un intercambio efectivo de genes.

En mis primeros paseos por la naturaleza me llamaba la atención el hecho de que, ciertamente, las mariposas, aves y mamíferos que veía podían asignarse netamente a alguna especie. En un paseo por el campo uno puede ver gorriones canoros, gorriones de los pantanos, gorriones campestres y gorriones gorgiblancos, pero no verá ningún gorrión que se halle entre dos de estas categorías. Las disputas sobre si dos poblaciones pertenecen o no a la misma especie suelen surgir cuando se trata de poblaciones separadas en el espacio o bien en el tiempo, con al menos una de ellas representada en el registro fósil. A Ben y a mí nos gustaba discutir sobre las relaciones evolutivas entre las especies, que son como las ramas de un árbol evolutivo cuya estructura queda representada por los agolpamientos posibles en géneros, familias y órdenes. Cuanto más distante es el parentesco entre dos especies más abajo hay que ir en el árbol para encontrar un antecesor común.

Ben y yo no pasábamos todo el tiempo al aire libre. También visitábamos museos de arte, con especial predilección por los que incluían abundante material arqueológico (como el Metropolitan Museum of Art) u objetos de la Europa medieval (como el museo Cloisters). Leíamos libros de historia y aprendimos a descifrar algunas inscripciones egipcias. Nos entreteníamos estudiando la gramática latina, francesa y española, y caímos en la cuenta de que muchas palabras del francés y el español (así como muchas de las palabras que el inglés ha tomado prestadas) derivaban del latín. Las lecturas acerca de la familia de las lenguas indoeuropeas nos enseñaron que muchas palabras inglesas, latinas o griegas tenían un origen común, con leyes de transformación regulares. Por ejemplo, la palabra «sal» (salí en inglés) corresponde a sal en latín y a halos en griego, mientras que la palabra «seis» (six en inglés) corresponde a s'ex en latín y a hex en griego; la letra s inicial del inglés y el latín deriva de un sonido griego indicado con la letra h y consistente en una exhalación rápida. Aquí tenemos otro árbol evolutivo, esta vez aplicable a las lenguas.

Los procesos históricos, los árboles evolutivos, la diversidad organizada y la variabilidad individual se encontraban por doquier. Nuestra exploración de la diversidad también nos hizo ver que en muchos casos ésta se encontraba en peligro. Ben y yo fuimos conservacionistas precoces. Contemplábamos cómo las escasas áreas alrededor de Nueva York que se mantenían en un estado más o menos natural se iban reduciendo y los pantanos, por ejemplo, eran desecados y urbanizados.

Ya en la década de los treinta habíamos adquirido una aguda conciencia de la finitud del planeta, de la degeneración de las comunidades vegetales y animales a causa de la actividad humana y de la importancia del control demográfico, así como de la conservación del suelo, de la protección de los bosques y cosas por el estilo. Naturalmente, la necesidad de estas reformas aún no estaba ligada en mi pensamiento con la evolución, a escala planetaria, de la sociedad humana hacia una sociedad más sostenible, aunque así es como lo veo ahora. Aun así, ya entonces especulaba sobre el futuro de la especie humana, especialmente estimulado por las novelas y cuentos de ciencia ficción de H.G. Wells, que me encantaba leer.

También devoraba libros de cuentos y, junto con Ben, leía antologías de poesía inglesa. De vez en cuando íbamos a algún concierto, incluso a la ópera, pero éramos muy pobres y casi siempre teníamos que contentamos con actividades que no costasen dinero. Hicimos algunas tentativas de tocar el piano y de cantar arias y canciones de Gilbert y Sullivan. Escuchábamos la radio buscando emisoras lejanas, tanto de onda larga como corta, y cuando conseguíamos sintonizar una escribíamos para que nos enviasen una tarjeta postal. Recuerdo vívidamente las de Australia, con imágenes del pájaro cucaburra.

Ben y yo ansiábamos comprender el mundo y disfrutar de él, sin establecer divisiones arbitrarias. No distinguíamos entre las ciencias naturales, las ciencias sociales y del comportamiento, las humanidades o las artes. De hecho, nunca he creído en la primacía de tales distinciones. Lo que siempre me ha llamado la atención es la unidad de la cultura humana, donde la ciencia ocupa una parte importante. Incluso la distinción entre naturaleza y cultura humana es poco nítida, pues hay que recordar que también nosotros somos parte de la naturaleza.

La especialización, aunque no deja de ser un rasgo necesario de nuestra civilización, debe complementarse con la integración a través del pensamiento interdisciplinario. Uno de los obstáculos que siguen oponiéndose a dicha integración es la línea divisoria entre los que se sienten cómodos con las matemáticas y los que no. Yo tuve la fortuna de poder ejercitar el razonamiento cuantitativo desde una edad temprana.

Aunque a Ben también le interesaban la física y las matemáticas, fue mi padre quien más me animó a estudiar ambas cosas. Inmigrante austrohúngaro, a principios de siglo interrumpió sus estudios en la Universidad de Viena para trasladarse a Estados Unidos y reunirse con sus padres, que habían emigrado unos años antes a Nueva York y tenían problemas para salir adelante. El primer trabajo de mi padre fue en un orfanato de Filadelfia, donde aprendió a hablar inglés y a jugar al béisbol. Aunque su adopción de la lengua inglesa fue tardía, la hablaba perfectamente, sin errores gramaticales ni fonéticos. Sólo podía adivinarse que era extranjero precisamente porque nunca cometía errores.

En los años veinte, después de ejercer unos cuantos trabajos, abrió la Arthur Gell-Mann School of Languages, donde enseñaba a otros inmigrantes a hablar un inglés impecable. También daba clases de alemán y contrató profesores de francés, español, italiano y portugués. La escuela tuvo cierto éxito, pero en 1929, el año en que nací yo, las cosas comenzaron a cambiar. No sólo se produjo la quiebra de la bolsa, sino que entró en vigor una severa ley de restricción de la inmigración. El número de alumnos potenciales de mi padre disminuyó por culpa de la nueva legislación y los que había se empobrecieron por culpa de la Depresión. Cuando yo tenía tres años, la escuela tuvo que cerrar y mi padre tuvo que emplearse en un banco para mantenernos, y crecí pensando en los viejos y buenos tiempos que no llegué a conocer.

Mi padre estaba interesado en las matemáticas, la física y la astronomía, y cada día podía pasarse horas encerrado en su estudio absorto en los libros sobre relatividad especial y general y sobre la expansión del universo. Fue él quien despertó mi interés por las matemáticas, que con el tiempo llegarían a apasionarme y admirarme por su coherencia y rigor.

En mi último año de bachillerato, a la hora de rellenar la solicitud de ingreso en Yale, tenía que decidir qué estudios quería cursar. Mi padre, con quien consulté la cuestión, no ocultó su desdén ante mi intención de estudiar arqueología o lingüística, argumentando que me moriría de hambre, y me propuso estudiar ingeniería, a lo que repliqué que, aparte de pasar más hambre todavía, cualquier ingenio que yo diseñase probablemente acabaría desmoronándose (más adelante, como resultado de un test de aptitud, se me recomendó «¡cualquier cosa menos ingeniería!»). Así que, como solución de compromiso, mi padre me propuso estudiar física.

Le dije que mis notas de física habían sido las peores de todo el bachillerato y que era la única asignatura que me había ido mal; que habíamos tenido que memorizar cosas como las siete máquinas simples: la palanca, el tomo, el plano inclinado y cosas por el estilo; que habíamos estudiado mecánica, calor, sonido, luz, electricidad y magnetismo, pero sin ninguna conexión entre los temas.

Mi padre pasó entonces de los argumentos económicos a los intelectuales y estéticos. Me aseguró que la física avanzada me resultaría mucho más interesante y satisfactoria que la del bachillerato, y que me apasionarían la relatividad y la mecánica cuántica. Decidí complacerlo a sabiendas de que podría cambiar de carrera cuando llegase a New Haven. Pero una vez allí desaparecieron las ganas de cambiar, y al cabo de poco tiempo ya estaba enganchado y comenzaba a disfrutar de la física teórica. Mi padre tenía razón en lo referente a la relatividad y la mecánica cuántica. A medida que las estudiaba iba comprendiendo que la belleza de la naturaleza se manifestaba tanto en la elegancia de sus principios como en el grito de un colimbo o en las estelas bioluminiscentes que dejan las marsopas en la noche.

Sistemas complejos adaptativos

Un maravilloso ejemplo de esa simplicidad en los principios de la naturaleza es la ley de la gravedad, y en concreto la teoría de la gravitación formulada en la relatividad general de Einstein (aunque para la mayoría de la gente esta teoría es cualquier cosa menos simple). En el curso de la evolución física del universo, el fenómeno de la gravitación dio origen a la agregación de la materia en galaxias y más tarde en estrellas y planetas, entre ellos nuestra Tierra. Desde el mismo momento de su formación, tales cuerpos ya manifestaban una cierta complejidad, diversidad e individualidad, pero estas propiedades adquirieron un nuevo significado con la aparición de los sistemas complejos adaptativos. En la Tierra este hecho estuvo ligado a los procesos del origen de la vida y la evolución biológica, que han generado la gran diversidad de especies existente. Nuestra propia especie, que al menos en algunos aspectos es la más compleja de las que han evolucionado hasta ahora en este planeta, ha llegado a descubrir gran parte de la simplicidad subyacente, incluyendo la teoría de la gravitación misma.

La investigación en las ciencias de la complejidad, tal como se desarrolla en el Instituto de Santa Fe y en cualquier parte del mundo, no sólo intenta desentrañar el significado de lo simple y lo complejo, sino también las semejanzas y diferencias entre los sistemas complejos adaptativos implicados en procesos tan diversos como el origen de la vida, la evolución biológica, la dinámica de los ecosistemas, el sistema inmunitario de los mamíferos, el aprendizaje y los procesos mentales en los animales (incluido el hombre), la evolución de las sociedades humanas, el comportamiento de los inversores en los mercados financieros y el empleo de programas y/o equipos informáticos diseñados para desarrollar estrategias o hacer predicciones basadas en observaciones previas.

Lo que tienen en común todos estos procesos es la existencia de un sistema complejo adaptativo que adquiere información acerca tanto de su entorno como de la interacción entre el propio sistema y dicho entorno, identificando regularidades, condensándolas en una especie de «esquema» o modelo y actuando en el mundo real sobre la base de dicho esquema. En cada caso hay diversos esquemas en competencia, y los resultados de la acción en el mundo real influyen de modo retroactivo en dicha competencia.

En muchos aspectos, cada uno de nosotros funciona como un sistema complejo adaptativo (de hecho, el término «esquema» se emplea desde hace tiempo en psicología para referirse a una estructura conceptual de la que el ser humano hace uso para comprender un conjunto de datos, para darle sentido).

Imaginemos que estamos en una ciudad extraña a una hora punta de la tarde intentando coger un taxi en una concurrida avenida que parte del centro. Vemos que los taxis pasan de largo sin pararse, muchas veces porque ya están ocupados, y nos percatamos de que en ese caso la luz del techo está apagada. ¡Aja! Hay que fijarse en los taxis con la luz del techo encendida. Entonces descubrimos que hay taxis que, a pesar de llevar esa luz encendida y no llevar pasajeros, tampoco paran. Hay que modificar el esquema. Pronto nos percatamos de que la luz del techo consta de una parte interna y una externa en donde puede leerse «fuera de servicio». Lo que necesitamos es un taxi que lleve encendida sólo la parte interna. Nuestra nueva idea se confirma cuando a una manzana de distancia vemos dos taxis que, tras dejar a sus pasajeros, encienden únicamente la luz interna del techo. Pero estos taxis son inmediatamente ocupados por otros peatones. Unos cuantos más acaban su carrera a poca distancia, pero también son ocupados enseguida. Aquí nos sentimos impelidos a ampliar nuestra búsqueda de un esquema válido, hasta que observamos que en sentido contrario pasan muchos taxis con sólo la luz interna encendida. Cruzamos la avenida, paramos uno y subimos.

Como ilustración adicional, imaginemos que se nos somete a un experimento psicológico en el que se nos muestra una larga secuencia de imágenes de objetos familiares. Las imágenes representan cosas diversas, y cada una puede aparecer varias veces. Cada cierto tiempo se nos pide que adivinemos qué imágenes van a aparecer. Entonces construimos esquemas mentales de la secuencia, inventando teorías sobre la estructura de ésta basadas en las imágenes que hemos visto antes. Cualquiera de estos esquemas, suplementado con la memoria de las últimas imágenes mostradas, nos permite hacer predicciones. Lo normal es que estas predicciones comiencen siendo erróneas, pero si la secuencia tiene una estructura fácil de captar, la discrepancia entre predicción y observación hará que los esquemas erróneos sean descartados en favor de otros mejores y pronto podremos prever con precisión cuál será la próxima imagen.

Imaginemos ahora un experimento similar ejecutado por un psicólogo sádico que nos muestra una secuencia sin estructura alguna. Probablemente continuaríamos elaborando esquemas fallidos que sólo acertarán de vez en cuando por puro azar. En este caso, los resultados en el mundo real no proporcionan ninguna guía para la elección de otro esquema que no sea «esta es una secuencia sin ton ni son». Pero a los seres humanos les cuesta aceptar una conclusión así.

Cuando alguien planea una nueva aventura comercial, mejora una receta o aprende un lenguaje, se está comportando como un sistema complejo adaptativo. Cuando uno adiestra un perro, está observando las acciones de un sistema complejo adaptativo y a la vez se está comportando como tal (si ocurre más lo segundo que lo primero, como suele ser el caso, es posible que sea el perro quien esté adiestrándole a uno). Cuando uno invierte en bolsa se convierte, junto con los otros inversores, en un sistema complejo adaptativo que forma parte de una entidad colectiva en evolución a través de los esfuerzos de todos sus componentes para mejorar su posición o, por lo menos, para sobrevivir económicamente. Tales entidades colectivas organizadas, del tipo de una empresa o una tribu, constituyen sistemas complejos adaptativos en sí mismas. La humanidad en conjunto no está aún demasiado bien organizada, pero en un grado considerable ya funciona también como un sistema complejo adaptativo.

El aprendizaje en su sentido habitual no es el único ejemplo de sistema complejo adaptativo. La evolución biológica proporciona muchos otros. Mientras que los seres humanos adquieren conocimiento principalmente a través del uso individual o colectivo de su cerebro, en los otros animales la herencia genética es responsable de una fracción mucho mayor de la información necesaria para la supervivencia; esta información, fruto de millones de años de evolución, subyace en lo que, de modo bastante vago, suele denominarse «instinto». Las mariposas monarca nacidas en diferentes lugares de los Estados Unidos «saben» emigrar hasta las laderas cubiertas de coníferas de los volcanes mejicanos, donde se concentran en gran número para pasar el invierno. Isaac Asimov, el conocido ex bioquímico, divulgador científico y escritor de ciencia ficción, me contó que en cierta ocasión mantuvo un debate público con un físico teórico que negaba que un perro tuviese conocimiento de las leyes del movimiento de Newton. Indignado, Isaac le preguntó si seguiría pensando lo mismo después de ver a un perro atrapando al vuelo un plato de plástico con la boca. Es obvio que la palabra «conocimiento» no tenía el mismo significado para ambos. Para el físico sería el resultado de un aprendizaje en el contexto cultural de la empresa científica humana; para Isaac sería el fruto de la evolución biológica a través de la información inscrita en los genes, suplementada con algo de aprendizaje basado en la experiencia.

También es la evolución biológica la que ha hecho surgir en los organismos la capacidad de aprender, ya sea en los paramecios, los perros o las personas. Asimismo, este proceso ha dado lugar a otras formas de sistema complejo adaptativo. Un ejemplo es el sistema inmunitario de los mamíferos, donde tienen lugar procesos muy similares a los de la evolución biológica, pero a una escala temporal de horas o días en lugar de millones de años. Tales procesos permiten identificar a tiempo los organismos invasores o las células extrañas y producir la oportuna respuesta inmunitaria.

Los sistemas complejos adaptativos muestran una tendencia general a generar otros sistemas de la misma categoría. La evolución biológica, por ejemplo, puede conducir tanto a soluciones «instintivas» de los problemas que debe afrontar un organismo como al desarrollo de una inteligencia suficiente para resolver los mismos problemas mediante el aprendizaje. El diagrama de la página siguiente ilustra las relaciones entre diversos sistemas complejos adaptativos terrestres. Hace unos cuatro mil millones de años, determinadas reacciones químicas que incluían algún mecanismo de reproducción y de transmisión de las variaciones condujeron a la aparición de la primera forma de vida y después a los diversos organismos que constituyen las comunidades ecológicas. Más tarde la vida originó nuevos sistemas complejos adaptativos, como el sistema inmunitario y los procesos de aprendizaje. En los seres humanos el desarrollo de la capacidad para el lenguaje simbólico convirtió el aprendizaje en una actividad cultural elaborada, y dentro de la cultura humana han surgido nuevos sistemas complejos adaptativos: sociedades, organizaciones, la economía o la ciencia, por citar unos cuantos. Ahora que la cultura humana ha creado ordenadores rápidos y poderosos, tenemos la posibilidad de hacer que actúen también como sistemas complejos adaptativos.

En el futuro la cultura humana puede dar lugar a nuevos sistemas complejos adaptativos. Un ejemplo, que ha sido tratado por la literatura de ciencia ficción, me llamó por primera vez la atención cuando, a principios de los cincuenta, el gran físico húngaro-norteamericano Leo Szilárd, ya retirado, nos invitó a un colega y a mí a asistir a un congreso internacional sobre control de armas. M i colega, «Murph» Goldberger (que sería presidente de Caltech y después director del Instituto de Estudios Avanzados de Princeton), replicó que sólo podría asistir a la segunda mitad del congreso; yo por mi parte respondí que sólo podría asistir a la primera mitad. Leo pensó un momento y después nos dijo: «No, no puede ser; vuestras neuronas no están interconectadas».

Es posible que algún día, para bien o para mal, tales interconexiones puedan llevarse a cabo. Un ser humano podría conectarse a un ordenador avanzado directamente (no a través de una consola o de la palabra) y a través de ese ordenador podría conectarse a otras personas. Los pensamientos y emociones podrían compartirse en su totalidad, no del modo selectivo y engañoso que permite el lenguaje. (Según una máxima atribuida a Voltaire, «los hombres... emplean el lenguaje sólo para disimular sus pensamientos».) Mi amiga Shirley Hufstedler dice que estar unidos por cables es algo que no recomendaría a una pareja a punto de casarse. Por mi parte no estoy seguro de que este procedimiento sea recomendable en ningún caso (aunque, si todo fuera bien, quizá podría aliviar algunos de los problemas humanos más intratables). Pero ciertamente crearía una nueva forma de sistema complejo adaptativo, un auténtico conglomerado de seres humanos.

001.jpg
Figura 1. Algunos sistemas complejos adaptativos del planeta Tierra

Los estudiosos de los sistemas complejos adaptativos comienzan a familiarizarse con sus propiedades generales y también con sus peculiaridades. Aunque difieren grandemente en sus características físicas, todos procesan información de algún modo. Este rasgo común es seguramente el mejor punto de partida para explorar su funcionamiento.

Capítulo 3
Información y complejidad

El estudio de cualquier sistema complejo adaptativo se concentra en la información, que llega al sistema en forma de un flujo de datos (por ejemplo, una secuencia de imágenes, mostradas a un sujeto en un experimento psicológico). Examinamos la manera en que el sistema percibe regularidades que extrae del flujo de datos separándolas de lo que es incidental o arbitrario y condensándolas en un esquema sujeto a variación (en el supuesto anterior, el sujeto crea y modifica continuamente leyes hipotéticas que se supone que gobiernan las regularidades encontradas en la secuencia de imágenes). Observamos cómo cada uno de los esquemas resultantes se combina entonces con información adicional, de la clase de la información incidental dejada de lado en la abstracción de regularidades a partir del flujo de datos, para generar un resultado aplicable al mundo real: la descripción de un sistema observado, la predicción de algún suceso o la prescripción del comportamiento del propio sistema complejo adaptativo. (En el experimento psicológico, el sujeto puede combinar un posible esquema basado en las imágenes anteriores con unas cuantas de las siguientes para hacer una predicción de las imágenes que saldrán a continuación. En este caso, como suele pasar, la información adicional procede de una porción posterior del mismo flujo de datos del que el esquema fue abstraído.) Finalmente, vemos qué efectos tiene dicha descripción, predicción o comportamiento en el mundo real; tales efectos son retroactivos, ejerciendo «presiones selectivas» sobre los esquemas en competencia, algunos de los cuales quedan desacreditados o descartados, mientras que otros sobreviven y prosperan. (En el ejemplo, un esquema predictivo contradicho por las imágenes subsiguientes presumiblemente será descartado por el sujeto, mientras que otro cuyas predicciones son correctas será conservado. Aquí el esquema se pone a prueba contrastándolo con una porción ulterior del mismo flujo de datos del que nació y del que se obtuvo la información adicional para hacer predicciones.) El funcionamiento de un sistema complejo adaptativo puede representarse en un diagrama como el de esta página, donde se hace hincapié en el flujo de información.

002.jpg
Figura 2. Funcionamiento de un sistema complejo adaptativo

Los sistemas complejos adaptativos se hallan sujetos a las leyes de la naturaleza, que a su vez se fundamentan en las leyes físicas de la materia y el universo. Por otra parte, la existencia de tales sistemas sólo es posible en condiciones particulares.

Para examinar el universo y la estructura de la materia podemos seguir la misma estrategia adoptada en el estudio de los sistemas complejos adaptativos: concentrarse en la información. ¿Cuáles son las regularidades y dónde entran la contingencia y la arbitrariedad?

Indeterminación cuántica y caótica

De acuerdo con la física decimonónica, el conocimiento exacto de las leyes del movimiento y de la configuración del universo en un momento dado permitiría, en principio, la predicción de la historia completa de éste. Ahora sabemos que esto es absolutamente falso. El universo es mecanocuántico, lo que implica que, aun conociendo su estado inicial y las leyes fundamentales de la materia, sólo puede calcularse un conjunto de probabilidades para las diferentes historias posibles. Por otra parte, esta «indeterminación» cuántica va mucho más allá de lo que suele creerse. Mucha gente conoce el principio de incertidumbre de Heisenberg, que prohíbe, por ejemplo, conocer simultáneamente con exactitud la posición y el momento de una partícula. Mientras que este principio ha sido ampliamente divulgado (a veces de manera francamente errónea) apenas se habla de la indeterminación adicional requerida por la mecánica cuántica. Más adelante volveremos sobre este tema.

Aunque la aproximación clásica esté justificada y, en consecuencia, pueda ignorarse la indeterminación mecanocuántica, todavía nos queda el extendido fenómeno del caos, en el que la evolución de un proceso dinámico no lineal es tan sensible a las condiciones iniciales que un cambio minúsculo en la situación al principio del proceso se traduce en una gran diferencia al final.

Algunas de las conclusiones contemporáneas sobre determinismo y caos en mecánica clásica ya fueron anticipados en 1903 por el matemático francés Henri Poincaré en su libro Ciencia y método (citamos por Ivars Peterson en Newton’s Clock [El reloj de Newton]):

«Si conociéramos con precisión infinita las leyes de la naturaleza y la situación inicial del universo, podríamos predecir exactamente la situación de este mismo universo en un momento posterior. Pero incluso aunque las leyes naturales no tuvieran ningún secreto para nosotros, sólo podríamos conocer la situación inicial de modo aproximado. Todo lo que necesitamos para poder decir que un fenómeno ha sido predicho y que está regido por leyes es poder predecir la situación posterior con la misma aproximación que la inicial. Pero esto no siempre es posible; puede ocurrir que las pequeñas diferencias en las condiciones iniciales se hagan muy grandes en el resultado final. Un pequeño error al principio producirá un error enorme al final. La predicción se hace imposible y tenemos un fenómeno fortuito.»

Uno de los artículos que llamaron la atención sobre el caos en los años sesenta fue publicado por el meteorólogo Edward N. Lorenz. De hecho, la meteorología es una fuente de ejemplos familiares de caos. Aunque las fotografías por satélite y el uso de potentes ordenadores han hecho que la predicción del tiempo sea absolutamente fiable para muchos propósitos, los partes meteorológicos todavía no pueden garantizarnos lo que mucha gente quiere saber: si lloverá o no aquí y mañana. Tanto el lugar exacto por donde pasará una tormenta como el momento en que descargará la lluvia pueden ser arbitrariamente sensibles a los detalles de los vientos y de la posición y estado físico de las nubes unos cuantos días o incluso unas horas antes. La más ligera imprecisión en los datos meteorológicos hace que uno no pueda fiarse de la previsión para mañana a la hora de planear una excursión.

Dado que nada puede medirse con una precisión absoluta, el caos da origen a una indeterminación efectiva en el nivel clásico que se superpone a la indeterminación cuántica. La interacción entre estas dos clases de impredictibilidad es un aspecto fascinante y todavía poco estudiado de la física contemporánea. El reto que supone comprender la relación entre la impredictibilidad de carácter cuántico y la de carácter caótico ha llegado incluso a llamar la atención de los editores de Los Angeles Times, tanto que en 1987 le dedicaron al tema un editorial en el que se señalaba la aparentemente paradójica incapacidad de los teóricos para encontrar la indeterminación de carácter caótico que debería aparecer superpuesta a la de carácter cuántico cuando se aplica la mecánica cuántica a sistemas que exhiben caos en el dominio clásico.

Pero la cuestión comienza a aclararse gracias al trabajo de diversos físicos teóricos, entre ellos Todd Brun, uno de mis discípulos. Sus resultados parecen indicar que, para muchos propósitos, es útil contemplar el caos como un mecanismo que amplifica a escala macroscópica la indeterminación inherente a la mecánica cuántica.

En los últimos tiempos se ha publicado un montón de artículos sobre caos escritos bastante a la ligera. Un término técnico, aplicado en principio a un fenómeno de la mecánica no lineal, ha acabado convirtiéndose en una especie de etiqueta para designar cualquier clase de complejidad o incertidumbre, real o aparente. Si en alguna de mis conferencias sobre, digamos, sistemas complejos adaptativos, menciono el fenómeno aunque sólo sea una vez, y a veces ni eso, estoy seguro de que seré felicitado al final por mi interesante charla sobre «caos».

El impacto de los descubrimientos científicos en la literatura y la cultura popular tiende a traducirse en que ciertos elementos de vocabulario, interpretados de modo vago o erróneo, suelen ser lo único que sobrevive al viaje desde la publicación técnica a los libros y revistas populares. Los dominios de aplicación o las distinciones importantes, y a veces las propias ideas, tienden a perderse por el camino. Piénsese si no en los usos populares de palabras como «ecología» o «salto cuántico», y ya no digamos de la expresión New Age «campo de energía». Naturalmente, uno siempre puede argumentar que palabras como «caos» o «energía» ya existían antes de convertirse en términos técnicos, pero lo que resulta distorsionado en el proceso de vulgarización es precisamente su significado técnico, no el original.

Dada la eficacia creciente de las técnicas literarias en la transformación de conceptos útiles en tópicos huecos, hay que esmerarse si se quiere evitar que las diversas nociones de complejidad corran la misma suerte. Más adelante las detallaremos y examinaremos el dominio de aplicación de cada una de ellas.

Pero antes, ¿qué se entiende por «complejo» cuando hablamos de «sistema complejo adaptativo» en el sentido aquí empleado? De hecho, no hace falta que la palabra «complejo» tenga un significado preciso en esta frase, que es puramente convencional. Su presencia implica la convicción de que tales sistemas poseen un grado mínimo de complejidad convenientemente definido.

La simplicidad hace referencia a la ausencia (o casi) de complejidad. Etimológicamente, simplicidad significa «plegado una vez», mientras que complejidad significa «todo trenzado» (nótese que tanto «plic-» para pliegue como «plej-» para trenza derivan de la misma raíz indoeuropea plek).

Diferentes formas de complejidad

¿Qué se entiende realmente por simplicidad y complejidad? ¿En qué sentido es simple la gravitación einsteniana y complejo un pez de colores? No son cuestiones sencillas —no es simple definir «simple»—. Probablemente no existe un único concepto de complejidad que pueda captar adecuadamente nuestras nociones intuitivas. Puede que se requieran varias definiciones diferentes, algunas quizá todavía por concebir.

Una definición de complejidad surge de la ciencia informática, y tiene que ver con el tiempo requerido por un ordenador para resolver un problema determinado. Dado que este tiempo depende también de la competencia del programador, el que se toma en consideración es el más corto posible, lo que se conoce habitualmente como «complejidad computacional» del problema.

Dicho tiempo mínimo depende aún de la elección del ordenador. Esta «dependencia del contexto» surge una y otra vez en los intentos de definición de complejidad. Pero los informáticos se interesan particularmente en conjuntos de problemas que son similares excepto en magnitud, y por lo tanto la cuestión principal es saber qué pasa con la complejidad computacional cuando la magnitud del problema aumenta ilimitadamente. ¿Cuál es la relación entre el tiempo mínimo y la magnitud del problema cuando ésta tiende a infinito? La respuesta a esta cuestión puede que sea independiente de los detalles del ordenador.

La complejidad computacional ha demostrado ser una noción verdaderamente útil, pero no se corresponde demasiado con el sentido habitual de la palabra «complejo», como cuando se dice que el argumento de un relato o la estructura de una organización son altamente complejos. En este contexto estamos más interesados en saber cuán largo sería el mensaje requerido para describir determinadas propiedades del sistema en cuestión que en saber cuánto se tardaría en resolver cierto problema con un ordenador.

En el seno de la ecología se ha debatido durante décadas si los sistemas «complejos», como las selvas tropicales, tienen un poder de recuperación mayor o menor que los sistemas comparativamente «simples», como los bosques alpinos de robles y coníferas. Aquí el poder de recuperación se refiere a la probabilidad de sobrevivir a (o incluso sacar partido de) perturbaciones tales como cambios climáticos, incendios u otras alteraciones del medio ambiente, hayan sido o no causadas por la actividad humana. Parece ser que entre los ecólogos se va imponiendo el argumento de que, hasta cierto punto, el ecosistema más complejo es el más resistente. ¿Pero qué se entiende aquí por simple y complejo? La respuesta tiene que ver ciertamente con la longitud de la descripción del bosque.

Una noción muy elemental de la complejidad de un bosque podría obtenerse contando el número de especies de árboles (menos de una docena en un bosque alpino típico de clima templado frente a cientos de ellas en una selva tropical). También se podría contar el número de especies de aves y mamíferos; otra vez saldrían ganando las selvas tropicales. Con los insectos las diferencias serían aún mayores —piénsese en el número de especies de insectos que debe de haber en la selva ecuatorial—. (Siempre se ha creído que este número debía de ser muy grande, pero las estimaciones recientes sugieren que es todavía más grande de lo que se pensaba. A partir de los estudios de Terry Erwin, de la Smithsonian Institution, consistentes en recoger y clasificar todos los insectos presentes en un solo árbol tropical, se ha visto que el número de especies, muchas de ellas nuevas para la ciencia, es del orden de diez veces mayor de lo que se suponía.)

También se pueden tomar en consideración las interacciones entre organismos, del tipo depredador-presa, parásito-huésped, polinizador-polinizado, etc.

Resolución

Ahora bien, ¿con qué detalle habría que hacer las observaciones? ¿Habría que considerar los microorganismos, virus incluidos? ¿Habría que atender a las interacciones más sutiles además de las obvias? Está claro que hay que detenerse en algún punto.

Por lo tanto, cuando se define una forma de complejidad siempre es necesario acotar el grado de detalle en la descripción del sistema, ignorando los detalles más finos. Los físicos llaman a esto «resolución». Piénsese en una imagen fotográfica. Si se amplía algún pequeño detalle de la misma se pondrán de manifiesto los gránulos individuales de la película y se verá sólo un montón de puntos que componen una imagen tosca del detalle observado. El título de la película de Antonioni Blow-Up se refiere a esa ampliación. El granulado de la fotografía impone un límite en la cantidad de información que puede proporcionar ésta. Si la película es de grano muy grueso, lo más que puede obtenerse es una imagen de baja resolución que da una impresión aproximada de lo fotografiado. Si un satélite espía fotografía un «complejo» militar desconocido con anterioridad, la medida de complejidad que se le asigne dependerá también del granulado de la película.

Una vez establecida la importancia de la resolución, aún queda pendiente la cuestión de cómo definir la complejidad de lo que se observa. ¿Qué caracteriza, por ejemplo, una red de comunicación compleja entre un cierto número (digamos N) de personas? Esta cuestión podría planteársele a un psicólogo o sociólogo que intente comparar lo bien o lo rápido que es resuelto un problema por las N personas en diferentes condiciones de comunicación. En un extremo (que llamaremos caso A) cada persona trabaja por su cuenta y no existe ninguna comunicación. En el otro (que llamaremos caso F) cada persona puede comunicarse con cualquier otra. El caso A es obviamente simple, pero ¿es el caso F mucho más complejo o es de una simplicidad comparable a la del caso A?

Para fijar el grado de detalle (resolución) supongamos que cada persona recibe un tratamiento equivalente, sin distinción de rasgos individuales, y es representada en un diagrama como un simple punto en posición arbitraria, siendo todos los puntos intercambiables. La comunicación entre dos personas cualesquiera es posible o imposible, sin gradaciones, y cuando existe se representa como un segmento (no orientado) que conecta dos puntos. El resultado es lo que los matemáticos llaman un «grafo no orientado».

La longitud de la descripción

Con el nivel de detalle así especificado puede explorarse el significado de la complejidad de un esquema de conexiones. Consideremos primero un pequeño número de puntos, por ejemplo ocho (N = 8). Es fácil entonces trazar parte de los esquemas que resultan, incluyendo algunos triviales. Los diagramas de la Figura 3 representan algunos de los esquemas de conexiones posibles entre ocho individuos. En A ningún punto está conectado con otro. En B hay puntos conectados y puntos aislados. En C todos los puntos están conectados, pero no aparecen todas las conexiones posibles. En D aparecen las conexiones que faltan en C y están ausentes las otras; D es lo que podríamos llamar el «complementario» de C y viceversa. Lo mismo podemos decir de E y B, y también de F y A: en el esquema A no hay conexiones, mientras que en el F están todas las posibles. ¿A qué esquemas hay que asignar mayor, o menor, complejidad?

003.jpg
Figura 3. Algunos esquemas de conexiones posibles entre ocho puntos

Todo el mundo estará de acuerdo en que A, que no tiene conexiones, es simple y que B, con algunas conexiones, es más complejo, o menos simple, que A. Pero ¿qué ocurre con el resto? El caso F es particularmente interesante. Inicialmente, uno podría pensar que se trata del más complejo de todos, pues es donde hay más conexiones. Ahora bien, ¿es esto razonable? ¿No resulta acaso igual de simple estar totalmente conectado que no estarlo en absoluto? Quizá F deba situarse junto con A en la parte inferior de la escala de complejidad.

Lo cual nos lleva de nuevo a la propuesta de definir la complejidad de un sistema por medio de la longitud de su descripción. La figura F resulta entonces tan simple como su complementaria A, ya que la frase «todos los puntos conectados» es más o menos igual de larga que la frase «ningún punto conectado». Por otra parte, la complejidad de E no es muy diferente de la de su complementario B, ya que la adición del término «complementario» no alarga significativamente la descripción. Lo mismo pasa con D y C. En general, los esquemas complementarios tendrán una complejidad semejante.

Los esquemas B y E son evidentemente más complejos que A y F, y lo mismo pasa con C y D. La comparación de B y E con C y D es más complicada. Según el criterio de la longitud de la descripción, podría parecer que C y D son más complejos, pero el que esto sea cierto depende en alguna medida del vocabulario disponible para efectuar la descripción.

Antes de seguir adelante, es interesante remarcar que los mismos diagramas y la misma argumentación que hemos desarrollado en relación con los esquemas de comunicación pueden aplicarse a otra situación de gran trascendencia para la ciencia, la tecnología y el comercio actuales. La informática moderna está haciendo rápidos progresos en la construcción y utilización de ordenadores «paralelos», mucho más efectivos que las máquinas convencionales en la resolución de ciertos problemas. En lugar de un único ordenador gigante que trabaja continuamente en un problema hasta su conclusión, se disponen numerosas unidades más pequeñas trabajando simultáneamente, con una determinada red de conexiones entre ellas. Una vez más podemos preguntamos qué significado tiene el que una red de comunicación sea más compleja que otra. De hecho, fue precisamente un físico que trabajaba en el diseño de un ordenador paralelo quien me planteó esta misma cuestión hace años, renovando así mi interés en el problema de la definición de la complejidad.

Recordemos la posibilidad de contar el número de especies, tener en cuenta las interacciones, etc., como opción para caracterizar las comunidades ecológicas simples y complejas. Si se hiciera una lista de, por ejemplo, los tipos de árboles presentes en una comunidad, la longitud de esta parte de la descripción sería más o menos proporcional al número de especies de árboles. También en este caso, por lo tanto, sería de hecho la longitud de la descripción lo que se estaría empleando como medida.

Dependencia del contexto

Si la complejidad se define en términos de la longitud de una descripción dada, entonces no es una propiedad intrínseca de la cosa descrita. Es obvio que la longitud de la descripción depende también del descriptor. (Me viene a la memoria el relato de James Thurber «The Glass in the Field» [El cristal en el campo], en el que un jilguero cuenta a los otros pájaros su colisión con una lámina de vidrio: «Volaba cruzando un prado cuando de pronto el aire cristalizó sobre mí».) Cualquier definición de complejidad es necesariamente dependiente del contexto, incluso subjetiva. El grado de detalle con que se efectúa la descripción del sistema tiene ya algo de subjetivo —también depende del observador o de los instrumentos de observación—. Así pues, en realidad estamos discutiendo una o más definiciones de complejidad que dependen de la descripción del sistema a cargo de otro sistema, presumiblemente un sistema complejo adaptativo que podría ser un observador humano.

Para precisar la noción de longitud de una descripción hay que eliminar la posibilidad de describir algo simplemente señalándolo, pues es tan fácil señalar un sistema complejo como uno simple. La descripción del sistema debe suponerse dirigida a un interlocutor lejano. También es fácil dar un nombre como «Sam» o «Judy» a algo extremadamente complicado, haciendo su descripción trivialmente corta. Hay que describir el sistema mediante un lenguaje previamente convenido y que no incluya términos especiales introducidos a propósito.

Aun así quedan muchas fuentes de arbitrariedad y subjetividad. La longitud de la descripción dependerá del lenguaje empleado y también del conocimiento o concepción del mundo que compartan los interlocutores. La descripción de un rinoceronte, por ejemplo, puede acortarse si ambos interlocutores ya saben lo que es un mamífero. La descripción de la órbita de un asteroide es muy diferente si los interlocutores conocen la ley de gravitación de Newton y su segunda ley del movimiento —también puede influir en la longitud de la descripción el hecho de que ambas partes conozcan las órbitas de M arte, Júpiter y la Tierra.

Concisión y complejidad bruta

Pero ¿qué pasa cuando la descripción se hace innecesariamente larga? Es como la historia del maestro que puso como deber a sus alumnos escribir una redacción de trescientas palabras. Uno de ellos, que se había pasado todo el tiempo jugando, a última hora garabateó lo siguiente: «Ayer tarde a los vecinos se les incendió la cocina y yo saqué la cabeza por la ventana y grité: “¡Fuego! ¡Fuego! ¡Fuego!...”». Así hasta completar las trescientas palabras exigidas. Sin embargo, de no haber sido por este requerimiento, podría perfectamente haber escrito «... grité “¡fuego!” doscientas ochenta veces» para comunicar lo mismo. Está claro que en nuestra definición de complejidad debemos referimos siempre a la longitud del mensaje más corto posible para describir el sistema.

Todos estos puntos pueden integrarse en una definición de lo que podría llamarse «complejidad bruta»: la longitud del mensaje más corto que describe un sistema, con una resolución dada, dirigido a un interlocutor distante y haciendo uso de un lenguaje y un conocimiento del mundo que ambas partes comparten (y saben que comparten) de antemano.

Algunas maneras familiares de describir un sistema no dan como resultado nada parecido al mensaje más corto. Por ejemplo, si describimos por separado las partes de un sistema (como las piezas de un coche o las células de un ser humano) junto con el modo en que se ensamblan entre sí, estamos ignorando muchas formas de comprimir el mensaje que harían uso de las similaridades entre las partes. Casi todas las células del cuerpo humano, por ejemplo, comparten los mismos genes, además de muchos otros rasgos comunes, y las células de un tejido cualquiera son incluso más similares. La descripción más corta debería tenerlo en cuenta.

Información algorítmica

Algunos expertos en teoría de la información hacen uso de una magnitud muy parecida a la complejidad bruta, aunque de definición más técnica y, naturalmente, relacionada con los ordenadores. Se parte de una descripción con una resolución dada y expresada en un lenguaje determinado, que es codificada en una cadena de ceros y unos por medio de algún procedimiento de codificación estándar. Cada elección de un 1 o un 0 es un «bit» (contracción de binary digit, «dígito binario» en inglés; binario porque sólo hay dos elecciones posibles, mientras que en el sistema decimal normal hay diez, los dígitos 0, 1, 2, 3, 4, 5, 6, 7, 8, 9). Lo que se maneja es una cadena de bits, o «mensaje codificado».

La magnitud definida recibe el nombre de «complejidad algorítmica», «contenido de información algorítmica» o «incertidumbre algorítmica». La palabra «algoritmo» se refiere a una regla para calcular algo y también, por extensión, a un programa de ordenador. El contenido de información algorítmica se refiere, como veremos, a la longitud de un programa de ordenador.

El significado original de algoritmo es algo diferente. Aunque suena parecido a «aritmética», que deriva del griego, en realidad la «t» se introdujo por analogía, y quizá sería más correcto decir «algorismo», que refleja mejor la etimología. La palabra deriva del nombre de un matemático árabe del siglo IX, Mohamed ben Musa al Khuarizmi, que fue quien introdujo el concepto de cero en la cultura occidental. El apellido indica que su familia procedía de la provincia de Khorezm, al sur del mar de Aral, dentro de la república ahora independiente de Uzbekistán. Escribió un tratado en cuyo título aparece la frase al jabr («la transposición» en árabe), de la que deriva la palabra «álgebra». Originalmente, la palabra «algorismo» hacía referencia al sistema decimal de numeración, que se cree llegó a Europa desde la India principalmente a través de la traducción al latín del «Algebra» de al Khuarizmi.

El contenido de información algorítmica fue introducido por tres autores, de modo independiente, en los años sesenta. Uno fue el gran matemático ruso Andréi N. Kolmogórov. Otro fue el norteamericano Gregory Chatin, que a la sazón contaba sólo quince años. El tercero fue otro norteamericano, Ray Solomonoff. Todos suponen la existencia de un ordenador ideal, de memoria infinita (o finita pero ampliable) y equipado con circuitos y programas predeterminados. Después consideran un mensaje codificado particular y los programas que hacen que el ordenador imprima el mensaje y después se pare. La longitud del más corto de tales programas es el contenido de información algorítmica del mensaje.

Hemos visto que existe una subjetividad o arbitrariedad inherente a la definición de complejidad bruta, que surge de fuentes como la resolución y el lenguaje empleado en la descripción del sistema. En el contenido de información algorítmica se introducen nuevas fuentes de arbitrariedad, a saber, el procedimiento de codificación particular que convierte la descripción del sistema en una cadena de bits, y los circuitos y programas particulares del ordenador.

Ninguna de estas fuentes de arbitrariedad incomoda demasiado a los matemáticos, que suelen moverse dentro de límites en los que la arbitrariedad finita se hace comparativamente insignificante. Acostumbran a considerar series de cadenas de bits similares y de longitud creciente, estudiando cómo se comporta el contenido de información algorítmica cuando la longitud tiende a infinito (lo que recuerda el tratamiento de la complejidad computacional de una serie de problemas similares a medida que el problema se hace infinitamente grande).

Volvamos al ordenador paralelo ideal compuesto de unidades, representadas por puntos, conectadas por enlaces de comunicación representados por líneas. Aquí Kolmogórov, Chaitin y Solomonoff no se interesarían demasiado por el contenido de información algorítmica de los diversos esquemas de conexiones entre ocho puntos en concreto, sino que se interrogarían sobre las conexiones entre N puntos cuando N tiende a infinito. En estas condiciones, ciertas diferencias en el comportamiento del contenido de información algorítmica (por ejemplo entre el esquema de conexiones más simple y el más complejo) hacen insignificantes las diferencias atribuibles al ordenador, el procedimiento de codificación e incluso el lenguaje de turno. Los teóricos de la información se interesan en si un cierto contenido de información algorítmica sigue aumentando a medida que N se aproxima a infinito y, si lo hace, a qué ritmo. No se preocupan demasiado por las diferencias, en comparación despreciables, en el contenido de información algorítmica introducidas por las diversas fuentes de arbitrariedad en el aparato descriptivo.

De todos estos estudios teóricos se puede extraer una interesante conclusión. Aunque no nos restrinjamos a sistemas que se hacen infinitamente grandes, es importante comprender que las discusiones sobre simplicidad y complejidad adquieren más sentido a medida que las cadenas de bits se hacen más largas. En el otro extremo, para una cadena de un solo bit, es evidente que no tiene sentido hablar de simplicidad y complejidad.

Definición de información

Es momento de dejar clara la distinción entre información algorítmica e información tal como la concibe, por ejemplo, Claude Shannon, el fundador de la moderna teoría de la información. Básicamente, la información tiene que ver con una selección entre diversas alternativas, y puede expresarse de modo muy simple si dichas alternativas pueden reducirse a una serie de elecciones entre alternativas binarias igualmente probables. Por ejemplo, si sabemos que el resultado de lanzar una moneda ha sido cruz en vez de cara, tenemos un bit de información. Si sabemos que el resultado de lanzar una moneda tres veces ha sido cara, cruz y cara, tenemos tres bits de información.

El juego de las veinte preguntas proporciona una bonita ilustración de las más diversas clases de información en la forma de elecciones sucesivas entre alternativas binarias igualmente probables, o tan cerca de la equiprobabilidad como el interrogador pueda conseguir. Se juega entre dos personas, una de las cuales piensa algo que la otra tiene que adivinar con veinte preguntas o menos, después de averiguar si es animal, vegetal o mineral. Las cuestiones sólo pueden responderse con un «sí» o un «no»; cada una es una alternativa binaria. Para el segundo jugador es ventajoso que sus preguntas le permitan acercarse todo lo posible a una elección entre alternativas igualmente probables. Sabiendo que la cosa es, por ejemplo, un mineral, no sería aconsejable que el interrogador preguntara directamente si se trata del diamante Esperanza. En vez de eso, podría preguntar algo así como «¿es natural?» (en oposición a manufacturado o tratado por manos humanas). Aquí la probabilidad de una respuesta afirmativa es más o menos igual a la de una respuesta negativa. Si la respuesta es «no», la siguiente cuestión podría ser «¿es un objeto concreto?» (en oposición a una clase de objetos). Cuando las probabilidades de una respuesta positiva o negativa son iguales, cada pregunta rinde un bit de información. Veinte bits de información corresponden a una elección entre 1 048 576 alternativas equiprobables, el producto de la multiplicación de 20 factores de 2 (este producto es el número de cadenas de bits diferentes de longitud 20).

Nótese que en el tratamiento del contenido de información algorítmica las cadenas de bits se emplean de modo diferente que en el de la información de Shannon. En el caso del contenido de información algorítmica se considera una cadena de bits (preferiblemente larga) y se miden sus regularidades internas mediante la longitud (en bits) del programa más corto que hará que un ordenador estándar la imprima y después se pare. En contraste, en el caso de la información uno puede considerar una elección entre todas las diferentes cadenas de bits de una longitud dada. Si todas son igualmente probables, su longitud es el número de bits de información.

Uno puede tratar también con un conjunto de cadenas de bits, que pueden ser igualmente probables, cada una con un contenido de información algorítmica particular. En ese caso es útil definir el promedio de la cantidad de información y también el promedio del contenido de información algorítmica, ambos determinados por el número de cadenas de bits.

Compresión y cadenas aleatorias

El contenido de información algorítmica tiene una propiedad muy curiosa. Para discutirla tenemos que fijamos en primer lugar en la «compresibilidad» relativa de diferentes mensajes. Para una cadena de bits de cierta longitud (digamos una muy larga) podemos preguntamos cuándo la complejidad algorítmica es baja y cuándo es alta. Si una cadena larga tiene la forma 110110110110110110110 . 110110, puede ser producida por un programa muy corto que imprima 110 un número determinado de veces. Esta cadena de bits tiene un contenido de información algorítmica muy bajo aunque sea larga. Esto quiere decir que es altamente compresible.

En contraste, puede demostrarse matemáticamente que la mayoría de cadenas de bits de una cierta longitud son incompresibles. En otras palabras, el programa más corto capaz de producirlas (y después detener el ordenador) es aquel que dice IM PRIM IR seguido de la cadena misma. Las cadenas de bits de esta clase tienen un contenido de información algorítmica máximo para una longitud dada. No hay ninguna regla, ni algoritmo, ni teorema que simplifique la descripción de la cadena y permita describirla con un mensaje más corto. Se les llama «aleatorias» precisamente porque no contienen regularidades que permitan comprimirlas. El hecho de que el contenido de información algorítmica sea máximo para las cadenas aleatorias justifica la denominación alternativa de incertidumbre algorítmica.

La no computabilidad de la información algorítmica

Una curiosa propiedad de la información algorítmica es que no es computable. Aunque la mayoría de cadenas de bits es aleatoria, no hay manera de conocer exactamente cuándo lo son. De hecho, en general no puede asegurarse que el contenido de información algorítmica de una cadena dada no sea menor de lo que pensamos. Esto se debe a que siempre puede haber un teorema que nunca encontraremos o un algoritmo que nunca descubriremos que permitiría comprimir la cadena de bits. De modo más preciso, no existe un procedimiento para encontrar todos los teoremas que permitirían una ulterior compresión. Esto fue demostrado hace unos años por Greg Chaitin, en un trabajo con reminiscencias de un famoso resultado de Kurt Gödel.

Gödel fue un lógico matemático que, a principios de la década de los treinta, dejó aturdidos a sus colegas con sus descubrimientos sobre las limitaciones de los sistemas de axiomas en matemáticas. Hasta entonces, los matemáticos creían posible formular un sistema de axiomas que demostrase ser consistente y del que, en principio, pudiese derivarse la verdad o falsedad de todas las proposiciones matemáticas. Gödel demostró que ninguna de estas metas es alcanzable.

Estas conclusiones negativas suponen un progreso monumental tanto en matemáticas como en la ciencia en general. Pueden compararse con el descubrimiento de Albert Einstein de que no es posible definir un tiempo o espacio absolutos, sino sólo un espacio-tiempo que sea combinación de ambos. De hecho, Gödel y Einstein eran buenos amigos. A principios de los cincuenta solía verlos paseando juntos en el Instituto de Estudios Avanzados de Princeton, en New Jersey. Formaban una curiosa pareja. Gödel era tan bajito que a su lado Einstein parecía alto. Nunca supe si discutían sobre cuestiones profundas de matemáticas o de física (Gödel trabajaba de vez en cuando en problemas de relatividad general) o del tiempo y de sus problemas de salud.

De entre las conclusiones de Gödel, las más relevantes para nuestra discusión son las relativas a la indecidibilidad: dado un sistema de axiomas matemáticos, siempre habrá proposiciones indecidibles sobre la base de tales axiomas. En otras palabras, hay proposiciones de las que, en principio, no puede demostrarse su verdad o falsedad.

Las proposiciones indecidibles más celebradas son aquellas que son independientes de los axiomas. Cuando se tiene una de tales proposiciones, el conjunto inicial de axiomas puede ampliarse introduciéndola como nuevo axioma, y lo mismo puede hacerse con la proposición contraria.

Pero hay otras proposiciones indecidibles de carácter distinto. Supongamos, por ejemplo, una proposición indecidible relativa a los enteros positivos de la forma «todo número par mayor que 2 tiene la propiedad siguiente.». En principio, si hubiese alguna excepción a tal proposición podríamos encontrarla, al cabo de un cierto tiempo, probando un número par tras otro (4, 6, 8, 10.) hasta dar con uno que contradiga el enunciado. Esto demostraría inmediatamente la falsedad de la proposición, pero también contradiría su indecidibilidad, pues indecidible quiere decir precisamente que no puede demostrarse si la proposición es verdadera o falsa. Por lo tanto, no puede haber excepciones. La proposición es «verdadera» en el sentido ordinario de la palabra.

Podemos concretar la cuestión considerando una proposición que, tras siglos de esfuerzos, nunca ha sido demostrada, aunque no se ha encontrado ninguna excepción que la refute. Se trata de la conjetura de Goldbach, que establece que todo número par mayor que 2 resulta de la suma de dos números primos (iguales o distintos). Un número primo es un número mayor que 1 que no es divisible por ningún número excepto él mismo y 1. Los primeros son 2, 3, 5, 7, 11, 13, 17, 19, 23, 29, 31 y 37. Es fácil ver que cualquier número par entre 4 y 62 puede expresarse al menos de una manera como suma de dos elementos de esta lista. Con el empleo de ordenadores se ha podido verificar esta propiedad hasta números pares increíblemente grandes. Sin embargo, ningún ordenador puede demostrar la conjetura, que siempre podría dejar de ser cierta para algún número aún más grande. Sólo una demostración matemática rigurosa podría convertir la conjetura en un teorema cierto.

No hay razón para pensar que la conjetura de Goldbach sea indecidible, pero supongamos que lo fuera. Entonces, aunque indemostrable, sería verdadera, pues no podría haber ninguna excepción a ella. La existencia de cualquier número par mayor que 2 que no fuera la suma de dos primos refutaría la conjetura, lo que contradiría su indecidibilidad.

La existencia oculta de tales teoremas verdaderos pero indemostrables significa, como Chaitin ha demostrado, que siempre puede haber uno que permita comprimir un mensaje largo cuando pensamos que es incompresible, o comprimirlo más cuando creemos haber encontrado el programa de ordenador más corto que hará imprimir el mensaje y parar. Así pues, en general no se puede estar seguro del contenido de información algorítmica; sólo puede establecerse un límite superior, un valor que no puede excederse. Dado que el valor real podría estar por debajo de este límite, el contenido de información algorítmica no es computable.

La no computabilidad es una propiedad que puede crear problemas, pero lo que en verdad impide que el contenido de información algorítmica pueda emplearse para definir la complejidad es otra cosa.

El contenido de información algorítmica es útil para la introducción de nociones como resolución, compresibilidad o cadena de bits, así como la de longitud de una descripción generada por un sistema observador, pero su nombre alternativo de incertidumbre algorítmica delata un importante defecto. El contenido de información algorítmica es mayor para las cadenas aleatorias. Es una medida de incertidumbre, que no es lo que suele entenderse por complejidad, ni en sentido ordinario ni en sentido más científico. Así pues, el contenido de información algorítmica no representa una complejidad verdadera o efectiva.

En cualquier discusión sobre incertidumbre hay que ser cuidadoso, pues el término no siempre significa exactamente lo mismo. Reparé en este escollo por primera vez hace tiempo, en mis contactos con la RAND Corporation.

Capítulo 4
Aleatoriedad

Cuando comencé a trabajar en Caltech en los años cincuenta, pensé en buscar un trabajo de asesoramiento para poder pagar algunas facturas. A los profesores de Caltech se les permitía ejercer de asesores un día a la semana, de manera que indagué entre mis colegas para ver qué posibilidades había. Dos de ellos me sugirieron la RAND Corporation, en Santa Mónica, cerca del muelle y la famosa Muscle Beach.

La RAND Corporation comenzó su andadura poco después de la segunda guerra mundial a raíz del proyecto RAND (acrónimo de research and development, investigación y desarrollo en inglés) de las fuerzas aéreas, con el objeto de asesorar a este cuerpo en materias tales como el ajuste de las misiones (es decir, las tareas asignadas al servicio) a la estrategia y el diseño de métodos racionales para su cumplimiento. Al poco tiempo su papel se extendió hasta incluir el asesoramiento sobre diversos asuntos gubernamentales, muchos de ellas relacionados con la defensa estratégica. Sin perder importancia, el proyecto RAND se limitó a suministrar una parte de los recursos financieros que precisaba la organización, que acabó convirtiéndose en una corporación sin ánimo de lucro, ramificada en múltiples conexiones con las actividades civiles. La RAND da empleo a especialistas en muchas áreas, entre ellas las ciencias políticas, la economía, la física, las matemáticas y la investigación operativa.

El departamento de física, constituido en su mayor parte por físicos teóricos, me contrató como asesor y comencé a tener algunos ingresos extras realizando estudios no clasificados. T res profesores del Caltech compartíamos coche y nos pasábamos todos los jueves en la RAND.

Los significados de «aleatorio»

Una de las cosas que mejor recuerdo de mis primeras visitas a la RAND es un pequeño montón de memorias recientes que me fue entregado para que pudiese familiarizarme con el trabajo que se estaba llevando a cabo. Una de las memorias era la RAND Table of Random Numbers, algo indudablemente útil, aunque de lectura poco emocionante (me dijeron, sin embargo, que el subtítulo And 100 000 Normal Deviates indujo a muchos bibliotecarios a guardarla en el estante de psicología patológica).

Lo que me pareció realmente interesante de aquella memoria fue un papelito que cayó revoloteando al suelo de entre sus hojas. Lo recogí y descubrí que era una fe de erratas. ¡Los matemáticos de la RAND daban correcciones de algunos de sus números aleatorios! ¿Habían detectado errores aleatorios en sus números aleatorios? Durante mucho tiempo contemplé esta anécdota como una escena más de la comedia humana, pero más tarde, reflexionando sobre ella, reparé en un hecho importante: la palabra «aleatorio» tiene más de un significado, incluso entre matemáticos y científicos.

Tal como hemos estado empleándola, aplicada por ejemplo a una única cadena de un millar de bits, aleatorio significa que la cadena es incompresible. En otras palabras, es tan irregular que no puede expresarse de manera más corta. No obstante, un segundo significado es que ha sido generada por medio de un proceso aleatorio, es decir, por un proceso azaroso semejante al acto de lanzar al aire una moneda, en el que se asignara un 1 a las caras y un 0 a las cruces. Estos dos significados no son exactamente iguales. Una secuencia de mil monedas lanzadas al aire podría producir una secuencia de mil caras, representada por una cadena de bits formada por mil unos, la cual distaría de ser una cadena de bits aleatoria. Por descontado, una secuencia de mil caras no es en absoluto probable; de hecho, la posibilidad de obtenerla es sólo de una entre un enorme número de trescientos dígitos. Dado que la mayoría de las cadenas de bits son incompresibles (aleatorias), o prácticamente incompresibles, una serie de mil monedas lanzadas al aire producirá con mucha frecuencia una cadena de bits aleatoria, pero no siempre. Una manera de evitar esta confusión consiste en referirse a los procesos azarosos como «estocásticos» en lugar de aleatorios, reservando este último término de modo preferente para las cadenas de bits incompresibles.

¿Qué significa entonces aleatorio en el contexto de la tabla de números aleatorios de la RAND? ¿Cómo podría darse una fe de erratas para una tabla de este tipo? Y, para empezar, ¿para qué sirve una tabla de números aleatorios?

Una de las actividades del departamento de física de la RAND entre 1956 y 1957 era un proyecto no clasificado con aplicaciones en astrofísica que requería cálculos de física básica. Me encargué de él contando con la ayuda de otro asesor, un viejo amigo llamado Keith Brueckner. Una parte de los cálculos consistía en determinar de manera aproximada un par de sumas muy difíciles. Uno de los físicos más interesantes de la RAND, Jess Marcum, se ofreció a hacerla por medio del método de Monte Carlo, empleando la tabla de números aleatorios.

Los números aleatorios y el método de Monte Cario

Este método resultaba muy apropiado para Jess, porque era tan buen tahúr como físico. En su juventud había ganado un buen dinero jugando al blackjack en los casinos. Su estrategia para ganar era el «método del estudiante», consistente en apostar flojo en la mayoría de manos, cuando las probabilidades estén ligeramente en contra, y apostar fuerte cuando las probabilidades estén a favor, por ejemplo cuando todas las cartas de valor 10 (los dieces y las figuras) estén en una cierta parte del mazo. Este método sólo resulta practicable cuando se juega con un único mazo de cartas; al poco, los casinos ajustaron sus procedimientos (adaptándolos a los «estudiantes») y comenzaron a emplear varios mazos a la vez. Jess se dedicó entonces a otros menesteres.

Una vez pidió un permiso de varios meses a la RAND para apostar en las carreras. Su método era hacer pronósticos sobre los pronosticadores. No pretendía ser un experto en caballos, simplemente estudiaba los folletos de las carreras para constatar cómo cuadraban los puntos que otorgaban los pronosticadores con los resultados reales, y después seguía las sugerencias de los pronosticadores que más acertaban. Añadió además otra mejora: justo antes de la carrera, comprobaba en la tabla de apuestas si los puntos referidos (que reflejaban las apuestas recibidas hasta ese momento) se correspondían con los de los buenos pronosticadores. Si no era así, es que la gente estaba siguiendo otros consejos, probablemente malos. Jess se abalanzaba a la ventanilla y apostaba mucho dinero. Siguiendo este método consiguió ganar regularmente en el hipódromo; sin embargo, al poco tiempo decidió que su salario en la RAND le proporcionaba prácticamente lo mismo y con menos riesgo, de modo que regresó a su trabajo. Así es como Jess acertó a estar disponible para ayudarme.

El método de Monte Carlo de sumar se aplica cuando el número de sumandos es realmente grande. Se tiene una ley (¡un algoritmo!) para calcular la primera cantidad a partir del número 1, la segunda cantidad a partir del número 2, y así sucesivamente; la ley es tal que el total varía de forma regular de un número al siguiente, y el cálculo de cada cantidad a partir del número correspondiente es largo y tedioso, por lo que nadie está dispuesto a hacer más cálculos de este tipo que los estrictamente necesarios. (En la actualidad, gracias a los rápidos y potentes ordenadores de que disponemos, muchas de tales sumas pueden hacerse directamente, pero los ordenadores de hace treinta y cinco años necesitaban de trucos como el método de Monte Carlo.)

Supongamos que tenemos que sumar 100 millones de sumandos, después de calcular cada uno de ellos a partir del número entero correspondiente, que, por supuesto, va de 1 a 100 millones. Para aplicar la aproximación de Monte Carlo, se emplea una tabla de números aleatorios para obtener, por ejemplo, 5000 números elegidos al azar entre 1 y 100 millones. Todos los números tienen la misma probabilidad de ser elegidos. Calculamos entonces los sumandos correspondientes a los 5000 números y los sumamos. Tomándolos como una muestra representativa del conjunto de los 100 millones de cantidades a sumar, obtenemos nuestra aproximación multiplicando el resultado por 100 millones y dividiéndolo por 5000 (es decir, multiplicándolo por 20 000). De este modo, hemos aproximado un cálculo muy largo por otro mucho menor.

¿Aleatorio o pseudoaleatorio?

Una tabla de números aleatorios es un conjunto de números enteros comprendidos entre 1 y un valor fijo grande en el que cada número ha sido elegido por un proceso estocástico en el que todos los números en el intervalo elegido tienen la misma probabilidad de aparecer. De hecho, tales tablas no se suelen generar de este modo, sino que son en realidad tablas de números pseudoaleatorios. Estos números los produce un ordenador mediante alguna ley matemática definida, pero tan confusa que pueda suponerse que simula un proceso azaroso (por ejemplo, podría emplearse una ley caótica, en el sentido técnico del término). La lista de números resultante puede comprobarse para determinar si satisface los criterios estadísticos que una tabla producida por un proceso estocástico auténtico satisfaría en la mayoría de casos. En el caso de la tabla de la RAND, ¿eran los números realmente pseudoaleatorios? ¿Reveló una comprobación de última hora que uno de tales criterios no se satisfacía lo suficiente? ¿Fue por eso por lo que se adjuntaba la fe de erratas? Pues bien, la respuesta a todas estas preguntas es «no». Después de todo, es posible generar una tabla de números aleatorios por medio de un proceso verdaderamente estocástico, como, por ejemplo, un fenómeno mecanocuántico. En efecto, la tabla de la RAND fue generada estocásticamente por medio del ruido producido en un tubo de vacío. Más aún, la fe de erratas se refería a los 100 000 números con distribución normal, y no a la propia tabla de números aleatorios. El misterio que resultó tan instructivo no era, después de todo, ningún misterio. No obstante, los métodos estocásticos requieren una gran cantidad de trabajo, y resulta más práctico dejar que un ordenador genere una secuencia siguiendo una ley determinista y asegurarse después de que las indeseables regularidades introducidas sean relativamente inofensivas en las situaciones en que va a utilizarse la tabla. Hay que tener en cuenta, no obstante, que puede resultar peligroso el empleo de secuencias pseudoaleatorias como si fuesen verdaderamente aleatorias.

Hace poco leí que una tabla de números pseudoaleatorios empleada en muchos laboratorios había resultado ser seriamente no aleatoria. Como consecuencia, ciertos cálculos efectuados con esos números estaban muy equivocados. Este incidente nos demuestra que las secuencias de números provenientes de procesos deterministas caóticos o cuasicaóticos pueden contener muchas regularidades.

El caos determinista en los mercados financieros

En ocasiones, secuencias que parecían estocásticas resultan ser en realidad parcialmente pseudoaleatorias. Por ejemplo, muchos economistas neoclásicos han predicado durante años que, en los mercados financieros, las fluctuaciones de precios en torno a los valores establecidos por los principios de mercado eran un «paseo aleatorio», es decir, un cierto tipo de proceso estocástico. Al mismo tiempo, es posible obtener asesoramiento financiero por parte de asesores bursátiles, que estudian concienzudamente en las gráficas las variaciones de los precios en función del tiempo y pretenden derivar de ellas predicciones sobre si los precios subirán o bajarán en un futuro próximo. Una vez leí un artículo de un economista que mostraba su ira ante la idea de que alguien pretendiese utilizar tal método para desafiar la fe de los economistas en que las fluctuaciones no son más que un proceso aleatorio.

En la actualidad ha quedado probado que la idea del carácter azaroso de las fluctuaciones financieras es errónea. De hecho, son en parte un proceso pseudoaleatorio, como el caos determinista; en principio contienen suficientes regularidades para que pueda ganarse dinero aprovechándolas. Ello no significa que uno pueda hacer fortuna con todas las panaceas financieras que ofrecen los asesores bursátiles; muchos de sus consejos no valen probablemente para nada. No obstante, la idea de que las fluctuaciones de precios son algo más que un proceso estocástico no es tan descabellada como creía el irritado economista del artículo. (Doyne Farmer y Norman Packard, dos físicos miembros de la familia del Instituto de Santa Fe, han abandonado su trabajo como investigadores para fundar una empresa de inversiones. Emplean técnicas derivadas de la teoría del caos determinista y los sistemas cuasicaóticos para descubrir las regularidades presentes en las fluctuaciones mercantiles e invertir de acuerdo con ellas. Comenzaron practicando sobre el papel unos cuantos meses, y más tarde invirtieron dinero procedente de un préstamo bancario. Hasta hoy, las cosas les han ido bastante bien.)

Resumamos los tres usos técnicos de la palabra aleatorio con los que nos hemos encontrado:

  1. Una cadena aleatoria de bits es una cadena tal que no existe ninguna regla para comprimir su descripción.
  2. Un proceso aleatorio es un proceso azaroso o estocástico. Si lo empleamos para generar una cadena de bits de cierta longitud, producirá a menudo secuencias aleatorias completamente incompresibles; sin embargo, ocasionalmente producirá cadenas con unas pocas regularidades que puedan comprimirse algo, y muy raras veces producirá secuencias muy regulares, altamente compresibles y en absoluto aleatorias.
  3. Una tabla de números aleatorios está generada normalmente por un proceso pseudoaleatorio —un proceso informático determinista que no es realmente un proceso estocástico, pero que es lo suficientemente confuso (por ejemplo, caótico) como para simular bastante bien un proceso realmente estocástico en la mayoría de aplicaciones, satisfaciendo algunos de los criterios estadísticos que cumpliría un proceso estocástico—. Cuando se emplean procesos pseudoaleatorios para producir cadenas de bits, las secuencias generadas se parecen mucho a los resultados obtenidos por un proceso azaroso.

Shakespeare y los monos escritores

Ya estamos preparados para comprender por qué la incertidumbre algorítmica (o contenido de información algorítmica) no se ajusta plenamente a nuestra idea intuitiva de complejidad. Consideremos el conocido ejemplo de los monos escritores, que golpean las teclas de sus máquinas de escribir de manera estocástica, con la misma probabilidad de teclear cualquier símbolo o un espacio en blanco cada vez. Me cuesta creer que algún mono de verdad se comporte nunca de esta manera, pero esto no importa aquí. Lo que nos preguntamos es cuál será la probabilidad de que, en un determinado período de tiempo, consiguiesen teclear las obras completas de Shakespeare (o, si se prefiere, todos los libros del Museo Británico, lo que ahora se llama la Biblioteca Británica). Naturalmente, si cierto número de monos teclease un número suficientemente grande de páginas, habría una probabilidad distinta de cero de que en la totalidad del texto escrito estuviese contenido un pasaje con las obras completas de Shakespeare (pongamos la edición Folio). Sin embargo, esta probabilidad sería inimaginablemente pequeña. Si todos los monos del mundo tecleasen sin descanso ocho horas al día durante diez mil años, la probabilidad de que compusiesen de modo conexo la edición Folio de las obras de Shakespeare seguiría siendo completamente despreciable.

En un cuento de Russell Maloney titulado «Inflexible Logic» (Lógica inflexible), aparecido en la revista The New Yorker hace algunos años, seis chimpancés comienzan a teclear sistemáticamente, sin dudas ni errores, los libros del Museo Británico, uno detrás de otro. Los pobres monos tienen un final desdichado: un científico los mata para preservar sus concepciones sobre las leyes de la probabilidad. El último chimpancé, agonizante, «se dejó caer ante su máquina de escribir. Penosamente, con su mano izquierda, sacó la última página terminada del Florio de Montaigne. Buscó a tientas un folio en blanco, lo puso en el carro y tecleó con un dedo: “LA CABAÑA DEL TÍO TOM, por Harriet Beecher Stowe, Capít...”. Luego, él también murió».

Consideremos un mono escritor, no del tipo descrito por Maloney, que escriba un texto de longitud igual a la edición Folio, y comparemos un producto típicamente simiesco con las obras de

Shakespeare. ¿Cuál tiene un mayor contenido de información algorítmica? Obviamente, la obra del mono. A través de un proceso azaroso (el segundo significado que dimos a la palabra aleatorio), es muy probable que el mono componga una cadena aleatoria o cuasialeatoria de símbolos (en el primer sentido de aleatorio). Si de alguna manera codificásemos el trabajo del mono en una cadena de bits, sería muy probable que tal secuencia exhibiese una incertidumbre algorítmica máxima, o prácticamente máxima, para una cadena de su longitud. Las obras de Shakespeare no son tan aleatorias. Las reglas de la gramática inglesa, la ortografía (pese al uso descuidado que Shakespeare hacía de un método ya de por sí poco sistemático), la necesidad de componer oraciones con sentido lógico y muchos otros factores, contribuyen a la regularidad en los textos de Shakespeare, haciendo que éstos posean un contenido de información algorítmica (o incertidumbre algorítmica) mucho menor que cualquier pasaje razonablemente probable de la misma longitud tecleado por un mono. Y esto es cierto para cualquier autor de habla inglesa: ¡todavía no hemos tenido en cuenta la genialidad de Shakespeare!

Complejidad efectiva

Resulta evidente que el contenido de información algorítmica o incertidumbre algorítmica, aunque a veces reciba el nombre de complejidad algorítmica, no se corresponde en la mayoría de situaciones con lo que entendemos por complejidad. Para definir la complejidad efectiva precisamos algo distinto de una magnitud que se hace máxima en las cadenas aleatorias. De hecho, son los aspectos no aleatorios de un sistema o una cadena los que contribuyen a su complejidad efectiva; ésta puede caracterizarse de modo aproximado por la longitud de una descripción concisa de las regularidades de dicho sistema o cadena. La complejidad bruta y el contenido de información algorítmica no se corresponden con lo que entendemos habitualmente por complejidad, porque se refieren a la longitud de una descripción concisa de la totalidad del sistema o cadena —incluyendo sus características aleatorias—, y no únicamente de sus regularidades.

Para discutir con mayor profundidad el concepto de complejidad efectiva es esencial examinar detalladamente la naturaleza de los sistemas complejos adaptativos. Veremos que el aprendizaje y la evolución requieren, entre otras cosas, la capacidad de distinguir lo aleatorio de lo regular. De esta forma, la complejidad efectiva de un sistema está relacionada con la descripción de sus regularidades por parte de otro sistema complejo adaptativo que lo esté observando.

Capítulo 5
Un niño aprendiendo a hablar

Cuando mi hija estaba aprendiendo a hablar, una de sus primeras frases era «Daddy go car-car», que recitaba cada mañana cuando me iba a trabajar. Que la frase aludiera a mí me producía una gran satisfacción, y me encantaba que ella estuviese realmente hablando, aunque su inglés todavía necesitara algo de práctica. Hasta hace poco no caí en la cuenta de que ciertos rasgos de la gramática inglesa estaban ya presentes en aquella frase. Pensemos, por ejemplo, en el orden de las palabras. En inglés el sujeto se antepone al verbo (lo que no ocurre en otras lenguas como, por ejemplo, el galés, el hawaiano y el malgache). El sujeto y el verbo estaban correctamente colocados, igual que la expresión «car-car». En la sentencia gramatical inglesa «[Dady] [is going away] [in his car]» el orden de los tres elementos es exactamente el mismo que en la aproximación del bebé.

Naturalmente, a medida que mi hija crecía su gramática mejoraba y en unos pocos años ya hablaba correctamente. Cualquier niño normal al cuidado de una persona que hable un lenguaje particular y lo emplee regularmente para dirigirse a él, aprenderá a hablar de modo gramaticalmente correcto ese mismo lenguaje al cabo de algunos años (aunque más de un norteamericano pensará que esto no es aplicable a muchos estudiantes de enseñanza secundaria). De hecho, la mayoría de niños son capaces de aprender dos y hasta tres lenguas, especialmente cuando el niño es cuidado habitualmente por más de una persona y cada una de ellas le habla regularmente en un lenguaje distinto. El aprendizaje se produce aunque la exposición del niño a un lenguaje particular sea a través de un solo hablante. Pero ¿cómo se las arregla el niño para saber, de entre las maneras posibles de construir un enunciado en un lenguaje dado, cuáles son gramaticales y cuáles no?

Imaginemos que haya sólo cincuenta mil enunciados posibles y que un niño ensaye sistemáticamente cincuenta enunciados nuevos cada día durante mil días, indicándole su madre pacientemente «bien» o «mal» en cada caso. Asumiendo este absurdo planteamiento y una memoria perfecta por parte del niño, éste necesitará un mínimo de tres años para conocer exactamente cuáles de entre los cincuenta mil enunciados posibles son gramaticales.

Un informático diría que este niño ficticio se ha construido un «listado» mental que incluiría todos los enunciados candidatos junto con la etiqueta «gramatical» o «no gramatical». Pero cincuenta mil enunciados es demasiado poco; está claro que los niños reales tienen que aprender de otra manera.

En cualquier lenguaje humano hay un número ilimitado de enunciados posibles, los cuales pueden contener un número arbitrariamente grande de oraciones que a su vez incluyen palabras y expresiones modificadoras. La longitud de un enunciado está limitada sólo por el tiempo disponible y por la paciencia y memoria del hablante y del oyente. Por otro lado, el vocabulario que se maneja suele incluir muchos miles de palabras. No hay modo de que un niño escuche o recite todos los enunciados posibles y elabore con ellos un listado. Es más, una vez completado el proceso real de aprendizaje, un niño puede decir si un enunciado nunca oído con anterioridad es gramatical o no.

Los niños tienen que elaborar, sin tener plena conciencia de ello, un conjunto provisional de reglas acerca de lo que es gramatical y lo que no. Después, a medida que continúan escuchando enunciados gramaticalmente correctos y ensayan ocasionalmente enunciados que les son corregidos, van modificando el conjunto de reglas, de nuevo sin tener necesariamente plena conciencia de ello. En inglés, por ejemplo, resulta fácil para un niño aprender la construcción regular o «débil» del pasado de un verbo añadiendo -ed o -d al presente. Más tarde, cuando se encuentra con irregularidades como sing y sang (presente y pasado del verbo «cantar», un verbo «fuerte»), el niño modifica el conjunto de reglas para incluir esta excepción. Pero esto puede llevarle a pronunciar, por ejemplo, bring y brang en vez de bring y brought (presente y pasado del verbo «traer»), un error que, una vez corregido, conducirá a una nueva modificación de las reglas. De este modo, a través del mejoramiento progresivo del conjunto de reglas internas, en la mente del niño va tomando forma una gramática.

Está claro que, mientras aprende a hablar, el niño hace uso de información gramatical que va adquiriendo año tras año a partir de ejemplos de enunciados gramaticales y no gramaticales. Pero, en vez de construir una lista, el niño comprime de alguna manera esta experiencia en un conjunto de reglas, una gramática interna que se ajusta incluso a enunciados nuevos no escuchados con anterioridad.

Ahora bien, la información obtenida del mundo exterior, por ejemplo de unos padres que hablan la lengua en cuestión, ¿es suficiente para construir tal gramática interna? Para Noam Chomsky y su escuela la respuesta es no: el niño tiene que estar equipado ya desde el nacimiento con una gran cantidad de información aplicable a la gramática de cualquier lengua natural humana. La única fuente plausible de dicha información es una tendencia innata, fruto de la evolución biológica, a hablar lenguas con ciertos rasgos gramaticales generales compartidos por todas las lenguas humanas naturales. La gramática de cada lengua particular contiene también rasgos adicionales no programados biológicamente. Muchos de ellos varían de una lengua a otra, pero otros probablemente son tan universales como los innatos. Son estos rasgos adicionales los que el niño tiene que aprender.

La gramática como esquema parcial

Naturalmente, el que un enunciado sea gramatical no significa que tenga que ajustarse a los hechos. Cualquier hispanohablante sabe que es gramaticalmente correcto decir «el cielo es verde con rayas rojas y amarillas», aunque tal cosa es improbable, por lo menos en la Tierra. Pero hay muchos otros criterios aparte de la mera veracidad que condicionan la elección de los enunciados gramaticales que uno pronuncia en cada ocasión.

Al construir una gramática interna, el niño separa efectivamente los rasgos gramaticales de todos los otros factores, en parte estocásticos, que conducen a los enunciados particulares que escucha. Sólo de este modo es posible la compresión en un conjunto de reglas gramaticales manejable.

El niño exhibe así la primera característica de un sistema complejo adaptativo. Ha comprimido ciertas regularidades identificadas en un cuerpo de experiencia dentro de un esquema que incluye reglas que gobiernan dicha experiencia, pero omite las circunstancias especiales en que las reglas deben aplicarse.

La gramática, sin embargo, no abarca todas las regularidades presentes en una lengua. También hay que considerar las reglas de los sonidos (lo que los lingüistas llaman la «fonética» de un lenguaje), las de la semántica (relativas a lo que tiene sentido y lo que no) y otras. El esquema gramatical, por lo tanto, no incluye todas las reglas del habla, y la gramática no es lo único que se echa en falta cuando se prescinde arbitrariamente de algún rasgo de la sucesión de datos lingüísticos. De todos modos, la adquisición infantil de una gramática es un ejemplo excelente de la construcción de un esquema, en este caso un esquema parcial.

El proceso de aprendizaje gramatical también pone de manifiesto las otras propiedades del funcionamiento de los sistemas complejos adaptativos. Un esquema está sujeto a variación. Para poner a prueba las diferentes variantes en el mundo real es necesario incorporar detalles adicionales como los que se dejaron de lado en la creación del esquema. De este modo se vuelve a encontrar en el mundo real una sucesión de datos de la misma clase que aquella de la que el esquema fue abstraído previamente. Finalmente, lo que ocurre en el mundo real determina qué variantes sobreviven.

En la adquisición de la gramática inglesa, el esquema varía cuando, por ejemplo, la regla de construcción del pasado simple de un verbo con la terminación -ed o -d es modificada por excepciones como sing-sang y bring-brought. Para poner a prueba estas variantes, el niño tiene que hacer uso del esquema en un enunciado real, restituyendo las circunstancias especiales eliminadas para hacer el esquema posible. El niño puede decir, por ejemplo, «Wesang a hymn yesterday morning» [Cantamos un himno ayer por la mañana]. El enunciado es satisfactorio. Si, en cambio, el niño dice «I brang home something to show you» [Traje algo a casa para enseñártelo], el padre podría replicar: «Es muy amable por tu parte enseñarme esta cucaracha que encontraste en casa de tía Bessie, pero deberías decir I brought...». Como resultado de esta experiencia, es probable que en el futuro el niño ensaye un nuevo esquema que dé cabida a ambas irregularidades (naturalmente, en muchos casos el esquema se pone a prueba simplemente cuando el niño escucha hablar a alguien).

Sistemas complejos adaptativos y complejidad efectiva

El funcionamiento de un sistema complejo adaptativo se muestra en el diagrama de la Figura 2. Puesto que un sistema complejo adaptativo extrae regularidades de entre lo aleatorio, es posible definir la complejidad en términos de la longitud del esquema empleado por un sistema complejo adaptativo para describir y predecir las propiedades de una sucesión de datos de entrada. Naturalmente, estos datos son por lo general relativos al funcionamiento de algún otro sistema que está siendo observado por el sistema complejo adaptativo considerado.

La utilización de la longitud de un esquema no significa una vuelta al concepto de complejidad bruta, pues el esquema no constituye una descripción completa de la sucesión de datos o del sistema observado, sino tan sólo de las regularidades abstraídas a partir de los datos disponibles. En algunos casos, como en el de la gramática, sólo se incluye un cierto tipo de regularidades, dejando aparte el resto, y el resultado es un esquema parcial.

Se podría concebir la complejidad gramatical en términos de un libro de texto de gramática. En pocas palabras, cuanto más largo es el texto más compleja es la gramática. Esto concuerda muy bien con la noción de complejidad como longitud de un esquema. Cada una de las pequeñas y fastidiosas excepciones incrementa la extensión del libro y la complejidad gramatical del lenguaje.

Aquí vuelven a aparecer fuentes de arbitrariedad tales como la resolución y el conocimiento o entendimiento compartidos inicialmente. En el caso de un libro de gramática, la resolución se corresponde con el grado de detalle alcanzado en el texto. ¿Se trata de una gramática muy elemental que deja de lado muchas excepciones y reglas poco claras, tratando sólo los puntos principales que necesita un viajero al que no le preocupe equivocarse de vez en cuando? ¿O se trata de un voluminoso tomo académico? Si es así, ¿es uno de los viejos textos familiares o una gramática generativa de las que se han puesto ahora de moda? Es obvio que la longitud del libro dependerá de tales distinciones. En cuanto al conocimiento inicial, considérese una gramática clásica de una lengua extranjera escrita en inglés para angloparlantes. Si se trata de una gramática holandesa (estrechamente relacionada con la inglesa y con similitudes evidentes), el número de conceptos gramaticales nuevos que habrá que introducir será bastante inferior al que habría que introducir en el caso del idioma navajo, cuya estructura es muy diferente de la del inglés. La gramática del navajo tendría que ser más larga. Del mismo modo, una hipotética gramática holandesa escrita para hablantes navajos tendría que ser presumiblemente más larga que una gramática holandesa escrita para ingleses.

Aun teniendo en cuenta estos factores, sigue siendo razonable relacionar la complejidad gramatical de una lengua con la longitud de un texto que describa su gramática. Sin embargo, sería más interesante poder mirar dentro del cerebro de un hablante nativo (cosa que los avances tecnológicos quizás hagan posible algún día) y observar cómo está codificada en él la gramática. La longitud del esquema representado por esta gramática interna proporcionaría una medida algo menos arbitraria de la complejidad gramatical. (Naturalmente, la definición de longitud en este caso puede ser sutil, dependiendo del modo en que esté codificada la información gramatical. ¿Está inscrita localmente en neuronas y sinapsis o distribuida de algún modo en una red general?)

Definimos la complejidad efectiva de un sistema, relativa a un sistema complejo adaptativo observador, como la longitud del esquema utilizado para describir sus regularidades. Podemos emplear el término «complejidad efectiva interna» cuando el esquema gobierna de algún modo el sistema objeto de discusión (igual que la gramática inscrita en el cerebro regula el habla) en vez de limitarse a ser un mero recurso de un observador externo, como el autor de un texto gramatical.

Separación entre regularidad y aleatoriedad

La utilidad del concepto de complejidad efectiva, especialmente cuando no es interna, depende de si el sistema complejo adaptativo observador es competente a la hora de identificar y comprimir regularidades y descartar lo que es incidental. Si no es así, la complejidad efectiva del sistema observado tiene que ver más con las limitaciones particulares del observador que con las propiedades del sistema observado. La eficiencia del observador con frecuencia resulta evidente, pero el concepto mismo de eficiencia plantea cuestiones profundas. Ya hemos visto que la noción de compresión óptima puede tropezar con el obstáculo de la no conmutabilidad. Pero, aparte de la compresión, ¿qué ocurre con la identificación de regularidades? ¿Está realmente bien definido el problema de identificar regularidades a partir de una sucesión de datos?

La tarea sería más fácil si la sucesión de datos fuera, en algún sentido, de longitud indefinida, como en el caso de un discurso o texto tan extenso que comprenda muestras representativas de todos los enunciados posibles (hasta una determinada longitud) que pueden pronunciarse en un lenguaje dado. De este modo hasta la más rara regularidad gramatical se mostraría una y otra vez en condiciones similares, resultando así distinguible de una regla falsa fruto de una mera fluctuación aleatoria (por ejemplo, en un texto corto en inglés el pretérito perfecto podría no aparecer, sugiriendo equivocadamente que en dicha lengua no existe tal tiempo verbal, mientras que en un texto muy largo no es probable que esto ocurra).

Identificación de ciertas clases de regularidad

Un grupo de físicos teóricos, entre ellos Jim Crutchfield, que trabaja en el Instituto de Santa Fe y en la universidad de California en Berkeley, ha hecho considerables progresos en la distinción entre regularidad y aleatoriedad dentro de una cadena de bits indefinidamente larga. Para ello definen clases que abarcan un abanico de regularidades y muestran cómo podría emplearse en principio un ordenador para encontrar y clasificar cualquier regularidad que caiga dentro de una de estas categorías. Pero estos métodos no proporcionan ningún algoritmo para identificar cada tipo de regularidad. No existe tal algoritmo. Sin embargo demuestran que en cuanto un computador ha encontrado regularidades pertenecientes a ciertas clases en una cadena de bits, puede deducir la presencia de nuevas regularidades pertenecientes a una clase más amplia e identificarlas. Esto es lo que se llama «aprendizaje jerárquico».

Por lo general, una clase de regularidades corresponde a un conjunto de modelos matemáticos para generar una sucesión de datos. Supongamos que la sucesión de datos es una cadena de bits que se sabe generada por un proceso al menos en parte estocástico, como el lanzamiento de una moneda. Un ejemplo muy simple de conjunto de modelos sería entonces el que surge de considerar una secuencia de lanzamientos de una moneda trucada, en que la probabilidad de que salga cara (un 1 en la cadena de bits) es algún valor fijo entre 0 y 1, distinto p ara cada modelo, mientras que la probabilidad de que salga cruz (un 0 en la cadena de bits) es 1 menos la probabilidad de que salga cara.

Si la probabilidad de que salga cara es 1/2, cualquier regularidad aparente en la secuencia sería únicamente debida al azar. A medida que la cadena de bits se alarga, la probabilidad de dejarse engañar por tales regularidades aleatorias disminuye, a la vez que aumenta la probabilidad de reconocer que la secuencia corresponde a una moneda no trucada. En el extremo opuesto, consideremos una cadena de dos bits. En el caso de una moneda no trucada, hay una posibilidad sobre cuatro de que ambos bits sean 1 (regularidad perfecta). Pero una secuencia así podría obtenerse también con una moneda de dos caras. Así pues, una corta cadena de bits procedente de una secuencia de lanzamientos de una moneda no trucada puede confundirse a menudo con la de una moneda fuertemente desequilibrada. En general, la ventaja de considerar una sucesión de datos indefinidamente larga es que se incrementa enormemente la posibilidad de discriminar entre modelos distintos, correspondiendo cada modelo a una clase particular de regularidades.

Una ligera complicación adicional podría consistir en imponer que todas las secuencias en que salgan dos caras seguidas sean descartadas. La regularidad resultante —que la cadena de bits nunca contendría dos unos seguidos— sería fácil de reconocer en cualquier cadena larga. Una complicación aún mayor podría consistir en descartar todas las secuencias que contengan un número par de caras seguidas.

Cuando un sistema complejo adaptativo recibe una sucesión de datos arbitrariamente larga, por ejemplo en la forma de una cadena de bits, puede dedicarse a buscar sistemáticamente regularidades de una clase dada (correspondientes a modelos de una clase dada), pero no hay ningún procedimiento exhaustivo para buscar todas las regularidades posibles. Cualquier regularidad identificada puede incorporarse entonces en un esquema que describa la sucesión de datos (o un sistema que la genere).

Partición de la sucesión de datos: Información mutua

Para identificar regularidades dentro de una sucesión de datos de entrada, un sistema complejo adaptativo típico divide dicha sucesión en numerosas partes comparables entre sí e investiga sus rasgos comunes. La información común a muchas partes, o «información mutua», sirve para diagnosticar regularidades. En el caso de un texto en un lenguaje determinado, los enunciados podrían ser las partes objeto de comparación. La información gramatical mutua entre los distintos enunciados pondría de manifiesto las regularidades gramaticales.

Sin embargo, la información mutua sólo sirve para identificar regularidades, y su magnitud no constituye una medida directa de la complejidad efectiva. Una vez han sido identificadas ciertas regularidades y se ha elaborado una concisa descripción de ellas, es la longitud de la descripción lo que mide la complejidad efectiva.

Alta complejidad efectiva y contenido de información algorítmica intermedio

Supongamos que en el sistema objeto de descripción no hay regularidades de ninguna clase, como ocurriría muchas veces (¡pero no siempre!) con un pasaje tecleado por nuestros proverbiales monos. Un sistema complejo adaptativo sería entonces incapaz de encontrar ningún esquema, pues los esquemas resumen regularidades. En otras palabras, el único esquema posible tendría longitud cero, y el sistema complejo adaptativo asignaría el valor cero a la complejidad efectiva del desorden aleatorio en estudio. Esto es absolutamente apropiado, pues la gramática de un puro galimatías debería tener longitud cero. Aunque el contenido de información algorítmica de una cadena de bits aleatoria de longitud dada es máximo, la complejidad efectiva es cero.

En el otro extremo de la escala, el contenido de información algorítmica de una cadena de bits enteramente regular, por ejemplo una sucesión de unos, es próxima a cero. La complejidad efectiva — la longitud del esquema que describe las regularidades de la cadena de bits— también debería ser próxima a cero, ya que el mensaje «todo 1» es muy corto.

Así pues, para que la complejidad efectiva tenga un valor apreciable el contenido de información algorítmica no debe ser ni demasiado bajo ni demasiado alto; en otras palabras, el sistema no debe estar ni demasiado ordenado ni demasiado desordenado.

El diagrama de la Figura 4 ilustra a grandes rasgos cómo la mayor complejidad efectiva posible de un sistema (relativa a un sistema complejo adaptativo observador) varía con el contenido de información algorítmica, alcanzando valores máximos en la zona intermedia entre el orden excesivo y el desorden excesivo. Muchas magnitudes importantes que surgen en el tratamiento de la simplicidad, la complejidad y los sistemas complejos adaptativos comparten esta misma propiedad.

004.jpg
Figura 4. Diagrama que muestra a grandes rasgos cómo varía la complejidad efectiva máxima con el contenido de infamación algorítmica

Cuando un sistema complejo adaptativo observa otro sistema e identifica algunas regularidades, el contenido de información algorítmica de la sucesión de datos procedente del sistema observado se expresa como la suma de dos términos: el contenido de información aparentemente regular y el contenido de información aparentemente estocástica. La longitud del esquema —la complejidad efectiva del sistema observado— se corresponde esencialmente con la fracción aparentemente regular del contenido de información. Para una sucesión aleatoria de datos, reconocida como tal, la complejidad efectiva es cero y el contenido de información algorítmica es atribuible en su totalidad al azar. Para una sucesión de datos perfectamente regular (por ejemplo, una larga cadena de bits que sólo contenga unos) el contenido de información algorítmica en su totalidad es regular (no existe fracción estocástica) pero extremadamente pequeño. Las situaciones más interesantes son las que se encuentran entre estos dos extremos, donde el contenido de información algorítmica es apreciable pero no máximo (para la longitud de la sucesión de datos) y es la suma de dos términos significativos, la fracción aparentemente regular (la complejidad efectiva) y la fracción aparentemente estocástica.

Aprendizaje mediante los genes o el cerebro

Aunque nuestro examen de los sistemas complejos adaptativos arranca con el ejemplo del aprendizaje en el niño, no es necesario acudir a algo tan sofisticado para ilustrar este concepto. También podrían servir nuestros parientes los primates —caricaturizados antes en la historia de la máquina de escribir—, lo mismo que un perro. De hecho, el adiestramiento de nuestras mascotas es una de las maneras de observar procesos de aprendizaje en otros mamíferos.

Enseñar a un perro a estarse quieto supone aplicar una abstracción a gran número de situaciones: permanecer sentado en el suelo, quedarse dentro de un coche con la ventanilla abierta, resistirse a perseguir una tentadora ardilla, etc. El perro aprende, por medio de recompensas y/o castigos, el esquema correspondiente a la orden de estarse quieto. Los esquemas alternativos como, por ejemplo, que haga una excepción a la hora de perseguir gatos, son (al menos en teoría) descartados a medida que progresa el aprendizaje. Pero aunque el perro adopte un esquema como éste estaremos ante el resultado del funcionamiento de un sistema complejo adaptativo. En este caso la competencia entre las presiones del entrenamiento y del instinto cazador habrá propiciado la supervivencia de un esquema distinto al deseado por el adiestrador.

Una vez dada la orden de estarse quieto, el perro entrenado incorpora los detalles apropiados a la situación concreta y aplica el esquema al mundo real en forma de una conducta que es premiada o castigada, lo que contribuye a determinar si el esquema sobrevive o no. Sin embargo, la tendencia a perseguir gatos o ardillas, que también influye en la competencia entre esquemas, no ha sido aprendida por el perro, sino que ha sido programada genéticamente como resultado de la evolución biológica.

Todos los organismos incorporan tales programas. Cuando una hormiga merodea en busca de alimento, sigue una pauta innata que ha evolucionado a lo largo de millones de años. Hace algún tiempo, Herb Simon, un prestigioso experto en psicología, economía e informática de la Universidad de Carnegie-Mellon, se valió de los movimientos de las hormigas para ilustrar el sentido de lo que yo llamo complejidad efectiva. La trayectoria seguida por una hormiga puede parecer compleja, pero las reglas del proceso de búsqueda son simples. La intrincada trayectoria de la hormiga manifiesta una elevada complejidad algorítmica, de la que sólo una pequeña parte es atribuible a las reglas que subyacen a las regularidades de la búsqueda. Pero esta pequeña parte constituye —al menos aproximadamente— la totalidad de la complejidad efectiva. El contenido de información algorítmica restante, el grueso de la complejidad aparente, es resultado de rasgos aleatorios del terreno explorado por la hormiga. (Hace poco hablé de este asunto con Herb, quien al final exclamó con sorna: «¡Esa hormiga debe de estar ya a un montón de kilómetros de aquí!».)

En una secuencia de organismos cada vez menos sofisticados —pongamos un perro, un pez de colores, un gusano y una ameba— el aprendizaje individual tiene cada vez menos relevancia en comparación con los instintos acumulados en el transcurso de la evolución biológica. Pero la propia evolución biológica puede ser descrita a su vez como un sistema complejo adaptativo, incluso en los organismos más sencillos.

Capítulo 6
Bacterias que desarrollan resistencia a los fármacos

De joven yo tenía la costumbre de hojear enciclopedias (un hábito que todavía persiste, para regocijo de mi familia). Una vez encontré un artículo sobre la enfermedad del bronce que me hizo pensar por vez primera en algunas de las cuestiones centrales de este libro.

La enfermedad del bronce es un conjunto de reacciones químicas responsables de la corrosión de las superficies de dicho metal en forma de manchas verdeazuladas que crecen y se extienden. En condiciones de humedad, la enfermedad puede propagarse por el aire de una superficie a otra y arruinar una colección completa de objetos de bronce. La protección contra la enfermedad del bronce no es un asunto baladí, ya que los jarrones de bronce chinos de la dinastía Shang, por poner un ejemplo, pueden llegar a valer hasta un millón de dólares. Cuando leí esto por primera vez, como pobre que era, mi punto de vista era bien diferente del de los coleccionistas.

Por lo que a mí respecta estaba maravillado. «¿En qué se diferencia la enfermedad del bronce de una plaga causada por un organismo vivo? ¿Obedece la enfermedad del bronce meramente a las leyes de la física y la química?». Pero ya de niño yo rechazaba, como han hecho los científicos serios durante generaciones, la idea de que la vida estuviese caracterizada por alguna «fuerza vital» más allá de la física y la química. No, una bacteria obedece igualmente a las leyes de la física y la química. Pero entonces, ¿cuál era la diferencia? Se me ocurrió que las bacterias (como todos los demás seres vivos) exhiben una variabilidad heredable y sujeta a la selección natural, mientras que en la enfermedad del bronce no hay ninguna evidencia de tales cosas. Ésta sí es una diferencia crítica.

Para explorar esta distinción un poco más, considérese el ejemplo del flujo turbulento de un fluido a través de una tubería. Se sabe desde hace más de un siglo que la energía se disipa en forma de remolinos cada vez más pequeños. Para describirlos, los físicos citan a menudo a Jonathan Swift:

Así, según observan los naturalistas, una pulga
Engendra pulgas menores que hacen presa en ella,
Y éstas engendran pulgas menores que las pican,
Y así hasta el infinito.

Y el físico y matemático L. F. Richardson compuso su propio ripio especialmente dedicado a los remolinos:

Grandes espirales generan pequeñas espirales,
Que se alimentan de su velocidad;
Y las pequeñas espirales generan espirales menores,
Y así hasta la viscosidad.

En cierto sentido, los remolinos pequeños nacen de los grandes. Si la tubería tiene dobleces y constricciones, puede que algunos remolinos grandes desaparezcan sin dejar descendencia, mientras que otros sobreviven y generan muchos remolinos pequeños, que a su vez generan otros más pequeños, y así sucesivamente. Así pues, los remolinos parecen exhibir una forma de variación y selección. Pero nadie ha sugerido nunca que se parezcan a la vida. ¿Qué propiedad importante falta en los remolinos que los organismos vivos poseen? ¿Qué es lo que distingue realmente el flujo turbulento de la evolución biológica?

La diferencia radica en la información que se maneja en uno y otro caso. No hay ningún indicio de que en el flujo turbulento tenga lugar ningún procesamiento significativo de información, ninguna síntesis de regularidades. En la evolución biológica, en cambio, la experiencia representada por la variación y selección natural en el pasado es transmitida a las generaciones futuras en un paquete de información altamente comprimida, el «genoma» (o conjunto de genes) de un organismo. Cada gen puede tener formas alternativas diferentes, que reciben el nombre de «alelos». El conjunto de alelos particulares de todos los genes de un organismo dado se conoce como «genotipo».

Los biólogos hacen hincapié en la distinción entre genotipo, que se aplica a la información hereditaria contenida en los genes de un organismo individual, y fenotipo, que se aplica a la apariencia y comportamiento del organismo en el curso de su vida. Naturalmente, los cambios en el genotipo, como la sustitución de un cierto alelo por otro, pueden afectar al fenotipo a través de la influencia de los genes en los procesos químicos del organismo. Pero durante el desarrollo del organismo el fenotipo también es influenciado por multitud de factores, muchos de ellos aleatorios. Piénsese en todas las circunstancias accidentales que afectan al desarrollo de un ser humano, desde las etapas unicelular y fetal, pasando por la infancia y la niñez, antes de que se haga posible la reproducción en la madurez. El genotipo de un ser humano individual es como una receta de cocina básica que admite amplias variaciones en el plato preparado al final por el cocinero. Un genotipo individual permite que emerja del proceso de desarrollo uno de los muchos adultos alternativos posibles, todos diferentes. En el caso de gemelos idénticos, que comparten el mismo genotipo, coexisten dos de los adultos alternativos diferentes. Cuando se crían por separado suministran a menudo una información preciosa sobre los papeles respectivos de la naturaleza y la educación en la formación del fenotipo adulto.

En el curso de la evolución biológica se producen, de generación en generación, cambios aleatorios que contribuyen, junto con las vicisitudes en el desarrollo individual, a los cambios fenotípicos que determinarán en parte si un organismo es viable y capaz de alcanzar la madurez, de reproducirse y de transferir así su genotipo, total o parcialmente, a la descendencia. Así pues, la distribución de genotipos en la población es el resultado de la combinación del azar y la selección natural.

La evolución de la resistencia a los fármacos en bacterias

Un ejemplo de evolución biológica de gran importancia para la humanidad contemporánea es el desarrollo de bacterias resistentes a los antibióticos. Por ejemplo, tras el empleo extensivo de la penicilina durante varias décadas para controlar ciertas especies de bacterias patógenas, han aparecido cepas que no muestran una sensibilidad especial al fármaco. Para tratar las enfermedades provocadas por estos gérmenes modificados se requieren nuevos antibióticos, y pueden causar mucho sufrimiento e incluso muerte antes de que las nuevas drogas sean perfeccionadas. De modo similar, el bacilo de la tuberculosis ha sido mantenido a raya durante décadas por ciertos antibióticos, pero en los últimos años han aparecido cepas resistentes. La tuberculosis vuelve a ser un problema sanitario importante, incluso en regiones donde antiguamente la enfermedad estaba controlada.

En la adquisición de la resistencia bacteriana a los fármacos suele desempeñar un importante papel el intercambio de material genético entre dos bacterias individuales. Este proceso, lo más cercano a la reproducción sexual de que son capaces organismos tan primitivos, fue observado por primera vez por Joshua Lederberg cuando era un graduado en Yale. Por entonces yo no me había graduado todavía, y recuerdo la atención que suscitó en el público en general el descubrimiento del sexo en el reino de los gérmenes; hasta la revista Time le dedicó un artículo al tema. Para Josh supuso un lanzamiento en su carrera que le llevaría finalmente al rectorado de la Universidad Rockefeller. Pero para simplificar la discusión sobre resistencia bacteriana a los fármacos ignoraré este fenómeno (mis excusas a Josh).

Por la misma razón propongo ignorar otro importante mecanismo de transferencia de material genético entre células, donde el transportador es un virus —un bacteriófago o «fago»— que infecta a las bacterias. En este proceso, llamado transducción, se basaron los experimentos precursores de la ingeniería genética.

Las investigaciones minuciosas sobre bacterias se han centrado en la especie Escherichia coli (o E. coli), común, inofensiva y hasta útil para la función digestiva en el intestino humano, pero que a menudo resulta patógena cuando infecta otras partes del cuerpo (y también, en ciertas formas mutantes, peligrosa incluso en el tracto digestivo). E. coli es un organismo unicelular cuyo material genético consiste en unos pocos miles de genes. Un gen típico es una secuencia de alrededor de un millar de «nucleótidos» (conocidos colectivamente como ADN). Estos componentes del ADN, que constituyen todos los genes de todos los organismos, son de cuatro clases, llamadas A, C, G y T, iniciales de sus nombres químicos. Todo gen forma parte de una cadena de nucleótidos más larga que, apareada con otra, forma la famosa doble hélice. La estructura de la doble hélice fue determinada en 1953 por Francis Crick y James Watson a partir de los trabajos de Rosalind Franklin y Maurice Wilkins. En E. coli hay dos cadenas helicoidales que contienen alrededor de cinco millones de nucleótidos cada una.

Los nucleótidos alineados a lo largo de ambas cadenas son complementarios entre sí, en el sentido de que A y T siempre se encuentran enfrentados, igual que G y C. Como la secuencia de nucleótidos de una cadena determina la de la otra, basta con fijarse en una de ellas para leer el mensaje que contienen.

Supongamos que en cada cadena hay justamente cinco millones de nucleótidos. Podemos codificar A como 00, C como 01, G como 10 y T como 11, de modo que los cinco millones de nucleótidos quedarán representados por una cadena de diez millones de ceros y unos, es decir, por una cadena de diez millones de bits. Esta cadena contiene la información que cada E. coli transmite a las células hijas, que se originan por la división en dos de la célula bacteriana inicial, un proceso en el que la doble hélice se duplica y surgen dos nuevas dobles hélices, una por cada célula hija.

Los nucleótidos de una cadena pueden ordenarse de muchas formas, lo que hace que las posibilidades matemáticas sean extremadamente numerosas. Para una cadena de, digamos, un millar de nucleótidos el número de secuencias diferentes concebibles sería de 4 × 4 × 4 ... × 4 × 4, mil veces. Este número, en la notación decimal usual, tiene alrededor de ¡600 dígitos! Sólo una pequeña fracción de las secuencias teóricamente posibles se encuentra en la naturaleza (la existencia de todas ellas requeriría muchos más átomos de los que hay en el universo). En la práctica, cada gen puede tener, en un momento dado, cientos de alelos diferentes con una probabilidad significativa de aparición dentro de la población bacteriana, distinguibles entre sí por sus diferentes efectos bioquímicos y fisiológicos.

Un gen puede experimentar mutaciones como resultado de accidentes diversos tales como la incidencia de un rayo cósmico o la presencia de ciertos reactivos químicos en el entorno. Una sola mutación puede tener un efecto significativo en el comportamiento celular. Por ejemplo, la mutación de un cierto gen en una célula de E. coli podría, en principio, producir un nuevo alelo que le confiriese resistencia a la penicilina. Esta resistencia podría entonces pasar a la descendencia de la célula al multiplicarse por divisiones celulares repetidas.

Las mutaciones son procesos aleatorios típicos. Supongamos que una única bacteria hospedada en un tejido produce una colonia compuesta por bacterias de idéntico genotipo. En esta colonia pueden aparecer formas mutantes que den lugar a su vez a nuevas colonias. De este modo los genotipos de la población bacteriana en el tejido infectado se diversifican. Si se aplica penicilina en cantidad suficiente, sólo las colonias resistentes continuarán creciendo. Lo importante es que las bacterias resistentes mutantes están ya presentes como resultado de una mutación aleatoria ancestral antes de que el fármaco comience a ejercer una presión selectiva en su favor. Y si no están presentes en el tejido, seguramente existen en alguna otra parte, o por lo menos aparecen de vez en cuando por azar y después desaparecen. Las mutaciones, como Lederberg demostró hace tiempo, no son inducidas por la penicilina.

La mutación génica que origina un alelo que confiere resistencia a los fármacos tiene, presumiblemente, algunos efectos desfavorables para la función celular. Si no fuera así, es seguro que tales alelos estarían ya presentes en gran número de células de E. coli, y la penicilina habría sido inútil desde el principio. Pero a medida que el empleo de la penicilina se extiende, la supervivencia de las cepas resistentes se ve favorecida, y cualquier posible desventaja funcional queda en un segundo plano (un ejemplo aún mejor sería un antibiótico diferente no tan frecuente en la naturaleza como la penicilina, ya que la bacteria habría tenido menos contactos con él antes de su empleo en medicina).

El desarrollo de la resistencia a los fármacos tiene lugar, pues, a través de un cambio en el genotipo, la cadena de unas decenas de millones de bits que la célula transfiere a sus descendientes. A través de los genes, la bacteria «aprende» a superar las amenazas a su supervivencia. Pero el genotipo contiene además una enorme cantidad de información que permite el funcionamiento de la célula bacteriana. Los genes contienen las lecciones de supervivencia aprendidas durante miles de millones de años de evolución biológica.

La experiencia de la especie E. coli y sus formas ancestrales no ha quedado registrada sólo para servir de referencia en un listado; las regularidades presentes en dicha experiencia han sido identificadas y comprimidas en la cadena representada por el genotipo. Algunas de estas regularidades, como la presencia frecuente de antibióticos en el medio, se han experimentado sólo en tiempos recientes, pero la mayoría son muy antiguas. El genotipo varía en cierto grado de un individuo a otro (o de una colonia de individuos genéticamente idénticos a otra), y las mutaciones accidentales pueden producirse en cualquier momento y ser transmitidas a la descendencia.

Es interesante comparar este tipo de aprendizaje con el que se basa en el uso del cerebro. Hemos hecho hincapié en que las formas mutantes de una bacteria que exhiben resistencia a un antibiótico pueden muy bien encontrarse presentes por puro azar cuando se aplica el fármaco y que, en cualquier caso, seguramente han existido alguna vez en el pasado. Las ideas, en cambio, surgen más a menudo como respuesta a un desafío, en vez de estar disponibles cuando éste se presenta. (Parece ser que hay ligeros indicios de mutaciones genéticas ocasionales que surgen como respuesta a la necesidad, pero, si el fenómeno en verdad existe, es insignificante en comparación con la mutación aleatoria.)

La evolución como sistema complejo adaptativo

¿En qué medida puede describirse el proceso evolutivo como la manifestación del funcionamiento de un sistema complejo adaptativo? El genotipo satisface los criterios de esquema: encapsula en forma altamente comprimida la experiencia del pasado y está sujeto a variación a través de las mutaciones. El genotipo en sí no es puesto a prueba directamente por la experiencia. Aunque controla en gran medida la química del organismo, el destino último de cada individuo depende también de factores medioambientales que no están bajo el control de los genes. En otras palabras, el fenotipo está codeterminado por el genotipo y por las condiciones del entorno, en gran parte aleatorias. Tal despliegue de esquemas —junto con la recepción de nuevos datos— para producir efectos en el mundo real es característico de un sistema complejo adaptativo.

Por último, en un organismo unicelular la supervivencia de cierto genotipo depende de que las células que lo portan sobrevivan hasta el momento de la división, así como las células descendientes, las descendientes de las descendientes, y así sucesivamente. Esto satisface el requerimiento de un bucle retroactivo en el que intervengan presiones selectivas. No hay duda de que la población bacteriana es un sistema complejo adaptativo.

La complejidad efectiva de una bacteria, en el sentido nuestro de longitud de un esquema, está evidentemente relacionada con la longitud del genoma (si hubiera partes del ADN que cumpliesen únicamente una función de relleno y no contribuyeran a la información genética, como parece ocurrir en los organismos superiores, habría que descontarlas). La longitud de la parte relevante del genoma proporciona una medida interna aproximada de la complejidad efectiva. Es interna porque se relaciona con el esquema del que se sirve el organismo para describir su propia herencia a sus descendientes, y no con un esquema diseñado por algún observador externo (esta medida se asemeja a la longitud de la gramática interna en el cerebro de un niño que aprende su lenguaje nativo, en oposición a la longitud de un libro que describe la gramática de dicho lenguaje). Es sólo una medida aproximada porque la evolución biológica, como cualquier otro sistema complejo adaptativo, lleva a cabo la tarea de síntesis de regularidades con eficiencia variable. A veces esta variabilidad invalida la medida, como es el caso de ciertos organismos cuya simplicidad es obvia y en cambio presentan un genoma de longitud anómala.

Pero la comparación entre genomas de distintos organismos revela deficiencias en la idea de emplear la complejidad efectiva, basada en la longitud de un esquema, como única medida de la complejidad de una especie. Al considerar diferencias sutiles pero importantes, como, por ejemplo, las que distinguen nuestra especie de nuestros parientes cercanos los grandes monos, hay que introducir ideas más sofisticadas.

Los cambios genéticos que permiten a una criatura simiesca desarrollar lenguajes, pensamiento avanzado y culturas elaboradas, manifestaciones todas de gran complejidad efectiva, son relativamente pequeños, pero de gran significación. La complejidad efectiva del nuevo genoma (humano), medida por su longitud, no es en sí misma una medida satisfactoria de la complejidad de los organismos correspondientes (personas), pues ligeras alteraciones del genoma han dado lugar a una gran complejidad efectiva de una clase nueva (complejidad cultural).

Es necesario, por lo tanto, suplementar la complejidad efectiva con el concepto de complejidad potencial. Cuando un modesto cambio en un esquema permite a un sistema complejo adaptativo crear una gran cantidad de complejidad efectiva nueva en un cierto período de tiempo, puede decirse que el esquema modificado ha tenido un gran incremento de complejidad potencial con respecto a un intervalo de tiempo dado. Volveremos más tarde sobre este tema, pero por ahora volvamos a la idea de la adaptación a los antibióticos como sistema complejo adaptativo y comparemos este cuadro con una teoría incorrecta de la adquisición de la resistencia.

Adaptación directa

Hoy día parece obvio que la resistencia a los fármacos se desarrolla principalmente a través de mecanismos genéticos como los que hemos estado considerando. Pero no siempre fue así. En los años cuarenta, cuando el uso de la penicilina estaba en sus comienzos y las sulfamidas eran todavía las armas predilectas en la batalla contra las infecciones bacterianas, la resistencia ya era un problema y unos cuantos científicos ofrecieron modelos muy diferentes para explicar su desarrollo. Uno de ellos fue el eminente químico inglés Cyril (más tarde Sir Cyril) Hinshelwood. Recuerdo haber leído su libro sobre el tema cuando era estudiante, y el escepticismo que ya entonces me inspiraron sus ideas.

La teoría de Hinshelwood era, naturalmente, una teoría química. Su libro estaba repleto de ecuaciones que describían velocidades de reacción. La idea general era que la presencia del fármaco provocaba cambios en el equilibrio químico de la célula bacteriana que iban en detrimento de la reproducción celular. Sin embargo, la exposición prolongada de la bacteria a altas dosis de medicamento producía, directamente por medios químicos, ajustes en el metabolismo celular que limitaban el efecto del fármaco y permitían a las células sobrevivir y dividirse. En la división celular, según la teoría, esta forma simple de resistencia pasaba mecánicamente a las células hijas a través de la composición química del material celular ordinario. El mecanismo propuesto era una simple retroacción negativa en un conjunto de reacciones químicas (un ejemplo de retroacción negativa lo tenemos cuando un coche en marcha comienza a salirse de rumbo y el conductor gira el volante para corregir la trayectoria).

En la teoría de Hinshelwood no intervenían los genes bacterianos. No había un sistema complejo adaptativo subyacente al desarrollo de la resistencia: ni compresión de la información, ni esquema, ni variación aleatoria ni selección. De hecho, un capítulo del libro está dedicado a refutar la idea de la selección de variantes surgidas espontáneamente.

La teoría de Hinshelwood se puede describir como de «adaptación directa». Se trata de procesos muy comunes. Considérese el funcionamiento de un termostato ajustado a una temperatura dada; el dispositivo enciende un calefactor cuando la temperatura cae por debajo de la de referencia y lo apaga cuando se alcanza de nuevo. En vez de un grupo de esquemas en competencia y evolución, el termostato tiene un programa fijo, y además muy simple. El dispositivo únicamente se dice a sí mismo, «hace frío; hace frío; hace calor; hace frío.» y actúa en consecuencia.

Es útil contrastar la adaptación directa con el funcionamiento de un sistema complejo adaptativo, lo que no quiere decir que la adaptación directa carezca de interés. De hecho, la mayor parte de las expectativas de la cibernética tras la segunda guerra mundial se centraban en los procesos de adaptación directa, especialmente la estabilización de sistemas por retroacción negativa. El principio básico es el mismo que el del termostato, pero los problemas que se presentan pueden constituir un reto mucho mayor.

Adaptación directa, sistemas expertos y sistemas complejos adaptativos

La palabra «cibernética» fue introducida por Norbert Wiener, un matemático bastante excéntrico y de gran talento del Instituto Tecnológico de Massachusetts (MIT), que fue un niño prodigio y nunca dejó de demostrarlo de las maneras más estrafalarias. Cuando yo era estudiante graduado en el MIT me lo encontraba de vez en cuando durmiendo en las escaleras y obstaculizando el paso con su oronda figura. Una vez asomó la cabeza por la puerta del despacho de mi director de tesis, Viki Weisskopf, y profirió unas palabras absolutamente incomprensibles para Viki. «Oh, pensaba que todos los intelectuales europeos conocían el chino», dijo Wiener, y se fue corriendo.

La palabra cibernética deriva del vocablo griego kubernetes, que significa timonel, del cual deriva también el verbo «gobernar». La cibernética, en efecto, tiene que ver con la dirección y el gobierno, como en el control de un autómata. Pero en los comienzos de la cibernética los autómatas no eran capaces de crear un esquema susceptible de evolución más allá de sus percepciones sensoriales. Sólo ahora estamos entrando en una era de autómatas que pueden considerarse verdaderos sistemas complejos adaptativos.

Pensemos, por ejemplo, en un autómata móvil. En la primera época de la cibernética podría haber sido equipado con sensores para detectar la presencia de un muro cercano y activar un dispositivo para evitarlo. Otros sensores podrían servir para detectar socavones en el camino y adoptar una forma de locomoción predeterminada para que el robot pueda superarlos. El diseño se centraría en proporcionar respuestas directas a señales del medio ambiente.

Después llegaron los «sistemas expertos», en los que la información suministrada por expertos humanos en un cierto campo se introducía en un ordenador en la forma de un «modelo interno» que sirviese para interpretar los datos de entrada. El avance en relación a los diseños anteriores es sutil, pero un ejemplo tomado de un campo distinto puede servir de ilustración. La diagnosis médica puede automatizarse hasta cierto punto componiendo, con el asesoramiento de especialistas, un «árbol de decisión» para el ordenador y dotándole de un criterio de decisión definido para cada rama basado en datos particulares del paciente. Un modelo interno como éste es fijo, a diferencia de los esquemas propios de los sistemas complejos adaptativos. El ordenador puede diagnosticar enfermedades, pero es incapaz de aprender nada de su experiencia con los sucesivos pacientes. En vez de eso sigue haciendo uso del mismo modelo interno desarrollado previamente.

Naturalmente, siempre se puede consultar otra vez a los expertos y rediseñar el modelo interno en función de los aciertos y fallos del diagnóstico informático. El sistema ampliado constituido por el ordenador, los diseñadores y los expertos puede contemplarse como un sistema complejo adaptativo, en este caso uno artificial con «humanos en el bucle».

Hoy día estamos entrando en una era de ordenadores y autómatas que funcionan como sistemas complejos adaptativos sin humanos en el bucle. Muchos autómatas futuros contendrán esquemas elaborados sujetos a variación y selección. Considérese un autómata móvil de seis patas que tenga en cada una un juego de sensores que detecten obstáculos y un procesador de información que responda de algún modo predeterminado a las señales procedentes de aquéllos para controlar el movimiento de la pata, ya sea arriba, abajo, adelante o atrás. Este juego de patas no sería más que un conjunto de dispositivos cibernéticos primitivos.

En la actualidad un diseño de robot podría incluir una forma de coordinación entre las patas, pero no a través de una unidad central de proceso. En vez de eso cada pata ejercería influencia en el comportamiento de las otras a través de enlaces de comunicación. El patrón de interacciones mutuas de las patas sería un esquema que podría estar sujeto a variaciones como, por ejemplo, las producidas por un generador de números pseudoaleatorios. Las presiones selectivas que influirían en la adopción o rechazo de los patrones candidatos podrían tener su origen en sensores adicionales que registrarían el comportamiento no sólo de una pata individual, sino de todo el conjunto, como por ejemplo si el autómata está avanzando o retrocediendo, o si la cara inferior está suficientemente separada del suelo. De este modo el autómata tendería a desarrollar un esquema que proporcionaría un modo de andar adecuado al tipo de terreno y sujeto a modificación en función de los cambios de éste. Un autómata así puede considerarse una forma de sistema complejo adaptativo primitivo.

Tengo noticias de que en el MIT se ha construido un robot semejante de seis patas que ha descubierto, entre otros, el modo de andar que emplean comúnmente los insectos: las patas delantera y trasera de un lado se mueven al unísono con la pata media del otro. El uso de este paso por el robot depende del terreno.

Considérese ahora, en contraste con un autómata que aprende unos pocos rasgos útiles del terreno que tiene que atravesar, un sistema complejo adaptativo capaz de explorar los rasgos generales, además de un sinfín de detalles, de un terreno mucho mayor: la totalidad del universo.

Capítulo 7
La empresa científica

La empresa científica humana constituye una hermosa ilustración del concepto de sistema complejo adaptativo. Los esquemas son en este caso las teorías, y lo que tiene lugar en el mundo real es la confrontación entre la teoría y la observación. Las nuevas teorías tienen que competir con las ya existentes, en parte en cuanto a coherencia y generalidad, pero en último término en cuanto a su capacidad de explicar las observaciones existentes y predecir correctamente otras nuevas. Cada teoría es una descripción altamente condensada de toda una clase de situaciones, y como tal tiene que suplementarse con los detalles de una o más de estas situaciones a fin de poder hacer predicciones concretas.

El papel de la teoría en la ciencia debería ser obvio, aunque en mi propio caso, pese a haber dedicado toda mi carrera profesional a la física teórica, me llevó mucho tiempo apreciarlo. Fue al ingresar en el MIT para graduarme cuando finalmente se me reveló cómo es en verdad la física teórica.

Cuando estudiaba en Yale siempre conseguía altas calificaciones en los cursos de ciencias y matemáticas sin entender por completo lo que estaba aprendiendo. A veces me parecía que sólo estaba allí para regurgitar en los exámenes la información con que me habían cebado en clase. Todo cambió tras acudir a una de las sesiones de los seminarios de física teórica que organizaban la Universidad de Harvard y el MIT. Pensaba que el seminario sería una especie de clase magistral; pero de hecho no fue una clase en absoluto, sino un debate serio sobre temas de física teórica, en particular de la física de los núcleos atómicos y partículas elementales. Asistieron profesores, investigadores y estudiantes graduados de ambas instituciones: un físico teórico pronunciaría una breve conferencia y después habría un debate general sobre el tema presentado. En aquel entonces yo era incapaz de apreciar en su justa medida tal actividad científica, pues mi modo de pensar se circunscribía a asistir a clase, aprobar exámenes y tener contento al profesor.

El conferenciante era un estudiante graduado de Harvard que acababa de presentar su tesis doctoral sobre el carácter del estado fundamental del boro 10 (B10), un núcleo atómico compuesto de cinco protones y cinco neutrones. Mediante un método aproximado que parecía prometedor, pero cuya validez aún no estaba garantizada, había hallado que el estado fundamental debía poseer un momento angular de «espín» de una unidad cuántica, como se esperaba que fuese. Cuando terminó de hablar, me pregunté qué impresión habrían causado sus cálculos a los eminentes físicos teóricos de la primera fila. Sin embargo, el primero en tomar la palabra no fue ningún teórico, sino un hombrecillo con barba de tres días que parecía haber salido arrastrándose de los sótanos del MIT. Dijo: «Oye, el espín ese no es uno. Es tres. ¡Lo acaban de medir!» De repente comprendí que la misión del físico teórico no es impresionar a los profesores que se sientan en primera fila, sino explicar los resultados de las observaciones. (Por supuesto, los experimentadores pueden cometer errores, pero en este caso las observaciones a las que se refería aquel desaseado sujeto resultaron ser correctas.)

Me avergoncé de mí mismo por no haber sido capaz de descubrir antes cómo funcionaba la empresa científica. El proceso por el cual las teorías resultan seleccionadas de acuerdo con la experiencia (así como por su coherencia y generalidad) no es muy diferente de la evolución biológica, donde se seleccionan patrones genéticos que tienden a producir organismos con una mayor capacidad de reproducción. El paralelismo entre estos dos procesos se me escaparía hasta muchos años después, cuando supe más sobre simplicidad y complejidad, y sobre sistemas complejos adaptativos.

En la actualidad, la mayoría de físicos son o bien teóricos o bien experimentales. A veces los teóricos van por delante, formulando un cuerpo teórico exitoso capaz de realizar predicciones que resultan repetidamente confirmadas experimentalmente. En otras ocasiones, los físicos experimentales encuentran resultados inesperados, y los teóricos tienen que volver a la pizarra. Pero no hay que dar por sentada la existencia de dos clases distintas de investigadores. No siempre fue así en física, y en otros campos, como la antropología cultural, la arqueología y la mayor parte de la biología, hay todavía muy pocos teóricos y no se les tiene un gran respeto. En biología molecular, una rama de la biología que goza hoy de gran prestigio, la mayoría de los enigmas teóricos han sido resueltos gracias a la genialidad de los experimentadores. A resultas de ello, muchos eminentes biólogos moleculares no creen necesaria la existencia de biólogos teóricos.

En contraposición, la biología de poblaciones cuenta con una larga y honorable tradición matemática, personificada en las figuras de Sir Ronald Fisher, J. B. S. Haldane y Sewall Wright entre otros. Gracias al trabajo de éstos y muchos otros teóricos, se han realizado y comprobado experimentalmente numerosas predicciones en genética de poblaciones, y hasta la propia literatura matemática se ha enriquecido.

Cuando una ciencia madura y sus métodos teóricos ganan en profundidad y potencia, la teoría tiende a emerger como especialidad. Sin embargo, los papeles respectivos de la teoría y la observación deberían considerarse por separado, haya o no expertos en cada una de estas actividades. Veamos cómo la interacción entre ambas disciplinas encaja en la noción de sistema complejo adaptativo.

Normalmente, las teorías surgen como resultado de multitud de observaciones, en el transcurso de las cuales se realiza un esfuerzo deliberado por separar el trigo de la paja, las leyes de las circunstancias especiales o meramente accidentales. Una teoría se formula como un principio o conjunto de principios simples, expresados en un mensaje relativamente corto. Como ha dicho Stephen Wolfram, es un paquete comprimido de información, aplicable a muchos casos particulares. Por regla general, existen varias teorías en competencia que comparten estas características. Para realizar predicciones particulares, cada teoría debe desplegarse, es decir, el enunciado general comprimido que constituye propiamente la teoría debe complementarse con información detallada sobre el caso particular en cuestión. Entonces las teorías pueden verificarse por medio de observaciones posteriores, muchas veces de carácter experimental. La bondad de las predicciones de cada teoría, en consonancia con los resultados de estas observaciones, contribuye a determinar su supervivencia. Las teorías en seria discordancia con los resultados de experimentos bien diseñados y cuidadosamente realizados (especialmente cuando se trata de experimentos con resultados repetidamente consistentes) tienden a ser desplazadas por otras mejores, mientras que las teorías que predicen y explican satisfactoriamente las observaciones tienden a ser aceptadas y sirven de base para teorías futuras (siempre y cuando no resulten cuestionadas más adelante por nuevas observaciones).

Falsabilidad e intriga

El filósofo Karl Popper ha remarcado que el rasgo esencial de la ciencia es que sus teorías son falsables. Las teorías científicas hacen predicciones verificables mediante observaciones posteriores. Cuando una teoría resulta contradicha por observaciones fiables repetidas debe considerarse errónea. La posibilidad del error está siempre presente, prestando un aire de intriga a toda actividad científica.

A veces, el retraso en la confirmación o refutación de una teoría es tan grande que sus proponentes fallecen antes de que se conozca el destino de su idea. Los que hemos trabajado en física fundamental en las últimas décadas hemos tenido la fortuna de ver comprobadas nuestras teorías en vida. La emoción de saber que la predicción propia ha sido verificada y que el nuevo esquema subyacente es básicamente correcto no siempre es fácil de transmitir, pero resulta abrumadora.

Se ha dicho también que las teorías sólo mueren cuando lo hacen sus promotores, aunque haya nuevas evidencias en contra. Esta observación suele dirigirse a las ciencias físicas, aunque mi impresión es que resulta mucho más aplicable a las difíciles y complejas ciencias de la vida y del comportamiento. En los años cincuenta a mi primera esposa, Margaret, estudiante de arqueología clásica, le produjo asombro descubrir que muchos físicos cambian de opinión cuando se enfrentan a evidencias que contradicen sus ideas favoritas.

Cuando en un cierto campo parece faltar la intriga, puede surgir la controversia sobre si éste es verdaderamente científico. Frecuentemente se critica al psicoanálisis por no ser falsable, y estoy de acuerdo con ello. El psicoanálisis es una teoría que describe la influencia en el comportamiento humano de los procesos mentales que tienen lugar fuera del estado consciente y cómo estos mismos procesos mentales tienen su inicio en determinadas vivencias, en especial las tempranas. (No hablaré del tratamiento psicoanalítico, que es otro asunto. Puede resultar útil al establecer una relación constructiva entre el psicoanalista y el paciente, pero esto no confirma las ideas del psicoanálisis. De la misma forma, el tratamiento podría resultar inútil aunque la mayoría de esas ideas fuesen correctas.)

Creo que probablemente hay mucho de cierto en la tradición psicoanalítica, pero que, hasta el momento presente, no constituye una ciencia puesto que no es falsable. ¿Hay algo que pueda decir un paciente, o un comportamiento que pueda mostrar, que no pueda reconciliarse de alguna manera con las ideas fundamentales del psicoanálisis? Si no es así, éstas no pueden constituir una teoría verdaderamente científica.

En la década de los sesenta acaricié la idea de pasarme de la física teórica a la psicología empírica o la psiquiatría. Quería aislar un subconjunto de ideas psicoanalíticas que fueran falsables y pudiesen constituir una teoría, y tratar luego de comprobarla. (Dicho conjunto de ideas podría no corresponderse exactamente con las de ninguna escuela psicoanalítica, pero al menos estaría íntimamente relacionado con el psicoanálisis en general. Tendría que ver con el papel de los procesos mentales exteriores a la conciencia en la vida diaria de la gente razonablemente normal, así como en los patrones repetitivos de comportamiento aparentemente inadaptado que exhibe la gente clasificada como neurótica.)

Durante algunos meses me dediqué a visitar a distinguidos psicoanalistas por un lado y psicólogos académicos (en aquella época todavía fuertemente influidos por el conductismo, pues la psicología cognitiva todavía estaba en pañales) por otro. Todos me desanimaron, aunque por diferentes razones. Muchos psicólogos tendían a creer que los procesos mentales inconscientes carecen de importancia, son demasiado difíciles de estudiar o ambas cosas a la vez, y que el psicoanálisis era una tontería que no valía la pena considerar. Los psicoanalistas pensaban que su disciplina estaba tan bien establecida que no hacía falta ningún esfuerzo por incorporar algunas de sus ideas dentro de la ciencia, y que cualquier investigación necesaria para afinar sus preceptos sería llevada a cabo mejor que nadie por los propios psicoanalistas en el curso de su trabajo con los pacientes. Abandoné finalmente mi propósito y proseguí en la física, pero muchos años después tuve la oportunidad de contribuir indirectamente a un nuevo esfuerzo por incorporar en la ciencia ciertas ideas sobre los procesos mentales conscientes e inconscientes y sobre sus efectos en las pautas de conducta. Aquel esfuerzo está rindiendo algunos resultados esperanzadores.

Presiones selectivas sobre la empresa científica

En la práctica, la empresa científica no se ajusta de modo preciso a ningún modelo bien definido. Idealmente, los científicos realizan experimentos de carácter exploratorio o para comprobar una propuesta teórica seria. Se supone que juzgan una teoría según lo exacta, general y coherente que sea la descripción de los datos que de ella se deduce. Se supone que no tienen prejuicios, ni son deshonestos o egoístas.

Pero los practicantes de la ciencia son, al fin y al cabo, seres humanos. No son inmunes a las influencias normales del egotismo, el interés económico, la moda, las ilusiones y la pereza. Un científico puede intentar apropiarse del crédito ajeno, iniciar a sabiendas un proyecto sin valor por los beneficios que obtendrá, o dar por sentada una idea convencional en lugar de buscar una explicación más convincente. De vez en cuando, los científicos llegan a falsear sus resultados, rompiendo el tabú más severo de su profesión.

No obstante, el filósofo, sociólogo o historiador de la ciencia ocasional que se agarra a estas desviaciones de la rectitud científica o de la práctica científica ideal para condenar por corrupta a toda la empresa, demuestra que no ha llegado a comprender su aspecto esencial. La empresa científica es, por naturaleza, autocorrectiva, y tiende a elevarse por encima de cualquier abuso que pueda producirse. Las noticias extravagantes y carentes de fundamento, como el caso de la poliagua o de la fusión fría, pronto son dejadas de lado. Engaños como el del hombre de Piltdown acaban por descubrirse. Los prejuicios, como los que hubo inicialmente contra la teoría de la relatividad, acaban siendo superados.

Un estudioso de los sistemas complejos adaptativos diría que, en la empresa científica, a las presiones selectivas que caracterizan la ciencia se suman las presiones selectivas familiares que intervienen en todos los asuntos humanos. Sin embargo, las presiones selectivas características de la ciencia desempeñan un papel crucial en el avance de nuestra comprensión de la naturaleza. Las observaciones repetidas y los cálculos (y las comparaciones entre ambos) tienden, sobre todo a largo plazo, a eliminar las imperfecciones (es decir, los rasgos defectuosos desde el punto de vista científico) introducidas por las otras presiones.

Aunque los detalles históricos de cualquier descubrimiento científico suelen ser algo confusos, el resultado final puede ser una clarificación general brillante, como en el caso de la formulación y verificación de una teoría unificadora.

Teorías que unifican y sintetizan

De vez en cuando, con una teoría se logra una notable síntesis, comprimiendo en un enunciado breve y elegante muchos fenómenos descritos anteriormente por separado y, en cierta forma, de manera inadecuada. Un excelente ejemplo procedente de la física fundamental es el trabajo que realizó James Clerk Maxwell entre los años 1850 y 1860 sobre la teoría del electromagnetismo.

En la antigüedad ya se conocían fenómenos electrostáticos simples y familiares, por ejemplo que el ámbar (elektron en griego) tiene la propiedad de atraer trocitos de plumas cuando se lo frota con una piel de gato. Análogamente, se conocían algunas propiedades del magnetismo, como el hecho de que el mineral llamado magnetita (un óxido de hierro cuyo nombre deriva de la región de Magnesia, en el Asia Menor, donde es muy común) es capaz de atraer trozos de hierro y magnetizarlos, de modo que pueden a su vez atraer otros trozos de hierro. William Gilbert, uno de los primeros científicos modernos, estudió algunas de las propiedades de la electricidad en su famoso tratado sobre magnetismo publicado en 1600. Sin embargo, electricidad y magnetismo eran considerados todavía dos categorías diferentes de fenómenos. Hasta el siglo XIX no se comprendió la estrechísima relación que hay entre una y otro.

Los experimentos sobre la corriente eléctrica que siguieron a la invención por Alejandro Volta de la primera batería eléctrica (la pila voltaica) hacia 1800 abrieron el camino para el descubrimiento de las interacciones entre electricidad y magnetismo. Hacia 1820, Hans Christian Oersted descubrió que una corriente eléctrica que circula por un cable produce un campo magnético que se enrosca alrededor de éste. En 1831, Michael Faraday observó que un campo magnético variable induce una corriente eléctrica en una espiral de alambre; la interpretación posterior de este hecho fue que un campo magnético variable en el tiempo produce un campo eléctrico.

005.jpg
Figura 5. Tres formas de escribir las ecuaciones de Maxwell

En la década de 1850, cuando Maxwell comenzó su trabajo sobre una descripción matemática exhaustiva de los fenómenos electromagnéticos, la mayor parte de las piezas que componían el rompecabezas ya habían sido formuladas en forma de leyes científicas. El mérito de Maxwell fue enunciar un conjunto de ecuaciones que reproducían dichas leyes, tal como se muestra en la Figura 5. La versión que ofrecen los libros de texto suele constar de cuatro ecuaciones. La primera representa la ley de Coulomb, que describe cómo las cargas eléctricas generan un campo eléctrico. La segunda expresa la conjetura de Ampère, según la cual no existen verdaderas cargas magnéticas (de modo que todo el magnetismo se debe a las corrientes eléctricas). La tercera reformula la ley de Faraday, que describe cómo se crea una corriente eléctrica a través de un campo magnético variable. La cuarta ecuación, tal como la enunció Maxwell por primera vez, no era más que la ley de Ampère, que describe cómo las corrientes eléctricas generan un campo magnético. Estudiando sus cuatro ecuaciones, Maxwell observó que había algo incorrecto en ellas; modificando la última ecuación consiguió corregir el error. El razonamiento que empleó en su época nos parecería hoy muy oscuro, pero podemos presentar una versión más clara adaptada a la física actual.

La conservación de la carga eléctrica total (su constancia en el tiempo) es una idea simple y elegante que, confirmada experimentalmente ya era uno de los principios básicos de la física en la época de Maxwell. Sin embargo, sus ecuaciones originales no respetaban este principio. ¿Qué clase de cambio en las ecuaciones permitiría recogerlo? La tercera ecuación contiene un término que describe la generación de un campo eléctrico por un campo magnético variable. ¿Por qué no habría de tener la cuarta ecuación un término análogo que describiese la generación de un campo magnético por un campo eléctrico variable? En efecto, para un valor particular del coeficiente (multiplicador) del nuevo término, la ecuación era consistente con la conservación de la carga eléctrica. Es más, este valor era lo suficientemente pequeño como para que Maxwell pudiese insertar el nuevo término sin introducir resultados contradictorios con cualquiera de los experimentos conocidos. Con el nuevo término, denominado «corriente de desplazamiento», las ecuaciones de Maxwell quedaron completas. Las disciplinas de la electricidad y el magnetismo quedaron enteramente unificadas por medio de una descripción elegante y consistente de los fenómenos electromagnéticos.

Ya podían explorarse las consecuencias del nuevo formalismo. Pronto se descubrió que las ecuaciones, con la inclusión del nuevo término, poseían «soluciones ondulatorias» —ondas electromagnéticas de todas las frecuencias, generadas de modo predecible por cargas eléctricas aceleradas—. En el vacío, todas las ondas viajarían a la misma velocidad. Cuando calculó esta velocidad, Maxwell halló que era idéntica, dentro del margen de error aceptado en la época, a la famosa velocidad de la luz, unos 300 000 kilómetros por segundo. ¿Sería posible que la luz consistiese en ondas electromagnéticas pertenecientes a una determinada banda de frecuencias? Esta conjetura ya había sido formulada anteriormente de forma vaga por Faraday, pero ganó en claridad y plausibilidad merced al trabajo de Maxwell. Aunque llevó años probarla experimentalmente, la idea resultó por completo correcta. Las ecuaciones de Maxwell requerían también la existencia de ondas de frecuencias superiores a las de la luz visible (que ahora reciben el nombre de rayos ultravioleta, rayos X. etc.), y también de frecuencias inferiores (lo que hoy denominamos rayos infrarrojos, microondas, ondas de radio, etc.). Todas estas formas de radiación electromagnética acabaron descubriéndose experimentalmente, lo que además de confirmar la teoría condujo a los extraordinarios avances tecnológicos con los que hoy estamos familiarizados.

La simplicidad de las teorías unificadas

Las ecuaciones de Maxwell describen en pocas líneas (el número exacto depende de lo compacta que sea la notación, como puede verse en la figura) el comportamiento del electromagnetismo en cualquier parte del universo. Conociendo las condiciones de contorno y las cargas y corrientes presentes, pueden determinarse los campos eléctrico y magnético. Las ecuaciones encierran los aspectos universales del electromagnetismo, sólo es preciso suplementarias en cada caso con detalles particulares. Identifican con precisión las regularidades y las comprimen en un pequeño paquete matemático de inmensa potencia. ¿Podríamos presentar un ejemplo de esquema más elegante?

Dado que la longitud del esquema es prácticamente cero, ése es el valor de su complejidad efectiva, tal como la hemos definido. En otras palabras, las leyes del electromagnetismo son extremadamente simples.

Un crítico puntilloso podría quejarse de que, aunque las ecuaciones de Maxwell son en efecto cortas, se necesitan ciertos conocimientos previos para comprender la notación en que están formuladas. Cuando publicó por primera vez sus ecuaciones, Maxwell utilizó una notación menos compacta que la que aprenden en la actualidad los universitarios, de modo que el conjunto parecía algo más largo. Análogamente, ahora podemos usar la notación relativista, que lo hace aún más corto. (En la figura están ilustradas las tres versiones.) El crítico podría exigir que en cada caso se incluyese en el esquema, además de las propias ecuaciones, una explicación de la notación utilizada.

Es una exigencia no del todo irrazonable. Como ya hemos dicho en relación a la complejidad bruta, sería engañoso emplear un lenguaje especial que redujese la longitud de una descripción. De hecho, las matemáticas subyacentes a las ecuaciones de Maxwell no son particularmente difíciles de explicar, pero aunque no fuese así la información necesaria para interpretarlas sería finita, lo cual resulta insignificante cuando consideramos que las ecuaciones son válidas para todos los campos eléctricos y magnéticos en cualquier lugar del universo. La compresión conseguida sigue siendo enorme.

La gravitación universal: Newton y Einstein

La gravitación constituye otro caso extraordinario de ley universal. Isaac Newton elaboró la primera versión, seguida dos siglos y medio después por otra más exacta, la teoría de la relatividad general de Albert Einstein.

Newton tuvo su brillante intuición sobre la universalidad de la gravitación a la edad de veintitrés años. En 1665 la Universidad de Cambridge se vio obligada a cerrar sus puertas debido a la peste, y Newton, licenciado de nuevo cuño, regresó a la casa de su familia en Woolsthorpe, Lincolnshire. Allí, entre 1665 y 1669, comenzó a desarrollar el cálculo diferencial e integral, así como la ley de la gravitación y sus tres leyes del movimiento. Además, llevó a cabo el famoso experimento de la descomposición de la luz blanca en los colores del arco iris por medio de un prisma. Cada uno de estos trabajos representó por sí solo un hito, y aunque a los historiadores de la ciencia les gusta recalcar que Newton no los completó en un único annus mirabilis, admiten que dio un buen impulso a todos ellos en ese período de tiempo. Como le gusta decir a mi esposa, la poetisa Marcia Southwick, sin duda podría haber escrito una redacción impresionante sobre el tema «Qué he hecho en mis vacaciones de verano».

La leyenda relaciona el descubrimiento de Newton de una ley universal de la gravitación con la caída de una manzana. ¿Sucedió realmente dicho episodio? Los historiadores de la ciencia no están seguros, pero no rechazan completamente esta posibilidad, pues hay cuatro fuentes distintas que hacen referencia al mismo. Una de ellas es la versión del historiador Conduitt:

«En 1666 se retiró de nuevo ... a su casa natal en Lincolnshire y, mientras estaba descansando en un jardín, se le ocurrió que la fuerza de la gravedad (que hace caer al suelo las manzanas que cuelgan del árbol) no estaba limitada a una cierta distancia desde la superficie de la Tierra, sino que podría extenderse mucho más lejos de lo que se pensaba. ¿Por qué no tan lejos como la Luna?, se dijo, y si así fuese tal vez podría influir en su movimiento y retenerla en su órbita. Inmediatamente comenzó a calcular cuáles serían las consecuencias de esta suposición, pero como no tenía libros a mano, empleó la estimación en uso entre geógrafos y marinos desde que Norwood había establecido que un grado de latitud sobre la superficie de la Tierra comprende 60 millas inglesas. Con esta aproximación sus cálculos no concordaban con su teoría. Este fracaso le llevó a considerar la idea de que, junto con la fuerza de gravedad, podría superponerse la que la Luna experimentaría si se viese arrastrada en un vórtice.»

En esta narración de los hechos pueden verse en acción algunos de los procesos que de vez en cuando tienen lugar en la vida de un científico teórico. Una idea le asalta a uno repentinamente. La idea hace posible la conexión entre dos conjuntos de fenómenos que antes se creían separados. Se formula entonces una teoría, algunas de cuyas consecuencias pueden predecirse; en física, el teórico «deja caer un cálculo» para determinarlas. Las predicciones pueden no estar de acuerdo con la experiencia, incluso aunque la teoría sea correcta, ya sea porque haya un error en las observaciones previas (como en el caso de Newton), ya sea porque el teórico haya cometido un error conceptual o matemático al aplicar la teoría. En este caso, el teórico puede modificar la teoría correcta (simple y elegante) y elaborar otra, más complicada, remendada a fin de acomodar el error. ¡Observemos el fragmento final de la cita de Conduitt sobre la peregrina fuerza de «vórtice» que Newton pensó añadir a la fuerza de gravedad!

Finalmente, las discrepancias entre teoría y observación se resolvieron y la teoría de la gravitación universal de Newton fue aceptada hasta su sustitución en 1915 por la teoría de la relatividad general de Einstein, que concuerda con la de Newton en el dominio en que todos los cuerpos se mueven muy lentamente en comparación con la velocidad de la luz. En el sistema solar, los planetas y satélites viajan a velocidades del orden de decenas de kilómetros por segundo, mientras que la velocidad de la luz es de alrededor de 300 000 kilómetros por segundo. Las correcciones einstenianas de la teoría de Newton son pues prácticamente inapreciables, y sólo pueden detectarse en un número muy reducido de observaciones. La teoría de Einstein ha superado todas las pruebas a las que ha sido sometida.

El reemplazo de una teoría excelente por otra aún mejor ha sido descrito de modo particular en el libro de Thomas Kuhn La estructura de las revoluciones científicas, cuyo punto de vista ha ejercido una enorme influencia. Este autor presta especial atención a los «cambios de paradigma», usando la palabra «paradigma» en un sentido bastante especial (¡podría decirse que abusando de ella!). Su tratamiento enfatiza los cambios que, en cuestiones de principio, se producen al imponerse una teoría mejorada.

En el caso de la gravitación, Kuhn podría señalar el hecho de que la teoría newtoniana hace uso de la «acción a distancia», es decir, de una fuerza gravitatoria que actúa instantáneamente, mientras que en la teoría einsteniana la interacción gravitatoria se propaga a la velocidad de la luz, al igual que la interacción electromagnética. En la teoría no relativista de Newton, el espacio y el tiempo se consideran separados y absolutos, y la gravedad no está relacionada en forma alguna con la geometría; por su parte, en la teoría de Einstein, el espacio y el tiempo se confunden (como ocurre siempre en la física relativista) y la gravedad se halla íntimamente relacionada con la geometría del espacio-tiempo. La relatividad general, a diferencia de la gravitación newtoniana, está fundamentada en el principio de equivalencia: es imposible distinguir localmente entre un campo gravitatorio y un sistema de referencia uniformemente acelerado (como un ascensor). Lo único que un observador puede percibir o medir localmente es la diferencia entre su aceleración propia y la aceleración local debida a la gravedad.

La interpretación basada en el cambio de paradigma se centra en las profundas diferencias filosóficas y de lenguaje entre la teoría antigua y la nueva. Kuhn no subraya el hecho (aunque, por supuesto, lo menciona) de que la vieja teoría puede proporcionar una aproximación suficientemente válida para realizar cálculos y predicciones dentro del dominio para el que fue desarrollada (en este caso sería el límite de velocidades relativas muy bajas). Sin embargo, me gustaría destacar esta característica, pues en la competencia entre esquemas en el marco de la empresa científica, el triunfo de un esquema sobre otro no implica necesariamente que el anterior sea abandonado y olvidado. De hecho, al final puede ser utilizado con mucha mayor frecuencia que su más preciso y sofisticado sucesor. Eso es lo que pasa ciertamente con las mecánicas newtoniana y einsteniana restringidas al sistema solar. La victoria en la pugna entre teorías científicas competidoras puede ser más una cuestión de degradación de la teoría antigua y promoción de la nueva que de muerte de la teoría desbancada. (Ni que decir tiene que a menudo la vieja teoría pierde todo valor, y entonces sólo los historiadores de la ciencia se molestan en discutir sobre ella.)

La ecuación de Einstein para la relatividad general

Gμν = 8πKTμν

representa para la gravitación lo que las ecuaciones de Maxwell para el electromagnetismo. El lado izquierdo de la ecuación hace referencia a la curvatura del espacio-tiempo (al campo gravitatorio), y el lado derecho a la densidad de energía, etc., de todo lo que no es campo gravitatorio. Expresa en una única y pequeña fórmula las características universales de los campos gravitatorios en todo el cosmos. A partir de las masas, las posiciones y las velocidades de todas las partículas materiales, puede calcularse el campo gravitatorio (y por lo tanto el efecto de la gravitación sobre el movimiento de un cuerpo de prueba) sea cual sea el lugar y momento. Es éste un esquema particularmente poderoso, que resume en un breve mensaje las propiedades generales de la gravedad en cualquier lugar.

Un crítico podría exigir de nuevo que incluyéramos como parte del esquema no sólo la fórmula, sino también una explicación de los símbolos que la componen. Mi padre, un abogado culto que batalló por comprender la teoría de Einstein, solía decir: «Mira qué simple y hermosa es esta teoría, pero ¿qué significan 7^ y G^?>» Como en el caso del electromagnetismo, aunque se tenga que incluir todo un curso de matemáticas dentro del esquema, la ecuación de Einstein seguirá siendo un prodigio de compresión, puesto que describe el comportamiento de todos los campos gravitatorios dondequiera que se encuentren. El esquema será todavía extraordinariamente pequeño, y su complejidad muy baja. La teoría de la relatividad general de Einstein para la gravedad es, pues, simple.

Capítulo 8
El poder de la teoría

La actitud intelectual del científico teórico no sólo es válida para investigar los secretos últimos del universo, sino también para otras muchas tareas. Todo lo que nos rodea son, a fin de cuentas, hechos relacionados entre sí. Naturalmente, pueden considerarse como entidades separadas y estudiarse de esta forma; no obstante, ¡qué diferentes resultan cuando los contemplamos como parte de un todo! Muchos elementos dejan de ser sólo detalles para memorizar: sus relaciones permiten elaborar una descripción comprimida, una forma de teoría, un esquema que los comprenda y resuma y en cuyo marco comienzen a tener sentido. El mundo se hace más comprensible.

El reconocimiento de formas es algo natural para los seres humanos; después de todo, nosotros mismos somos sistemas complejos adaptativos. Poseemos en nuestra naturaleza, tanto por herencia biológica como por transmisión cultural, la capacidad de reconocer patrones, identificar regularidades, construir esquemas mentales. A menudo, estos esquemas son favorecidos o relegados, aceptados o rechazados, en respuesta a presiones selectivas muy diferentes de las que operan en el mundo de la ciencia, donde es tan fundamental el acuerdo con la experiencia.

Las aproximaciones acientíficas para la elaboración de modelos del mundo que nos rodea han caracterizado el pensamiento humano desde tiempos inmemoriales, y siguen estando muy extendidas. Tomemos, por ejemplo, la magia simpática basada en la consideración de que las cosas similares están relacionadas. Para mucha gente de todo el mundo resulta natural, cuando hace falta que llueva, ejecutar una ceremonia en la que se derrame en el suelo agua proveniente de algún lugar especial. La semejanza entre la acción realizada y el fenómeno deseado sugiere que debería existir una conexión causal entre ambos. Las presiones selectivas que ayudan a mantener tal creencia no incluyen el éxito objetivo, el criterio aplicado en la ciencia (al menos, cuando la ciencia funciona correctamente). En su lugar operan otros tipos de selección. Por ejemplo, puede haber ciertos individuos investidos de poder que ejecuten la ceremonia y estimulen la creencia con objeto de perpetuar su autoridad.

La misma sociedad puede estar familiarizada con la magia simpática que opera a través de un efecto sobre la gente, como, por ejemplo, comer el corazón de un león para aumentar la bravura de un guerrero. En este caso puede obtenerse algún éxito objetivo, simplemente por efectos psicológicos: si un hombre cree que lo que ha ingerido lo hará más valiente, eso puede darle la convicción necesaria para actuar valientemente. Análogamente, la brujería destructiva (basada o no en la magia simpática) puede tener un éxito objetivo si la víctima cree en ella y sabe que se le está practicando. Pongamos por caso que alguien quiere hacerme daño y construye un muñeco de cera a imagen mía en el que pega algunos cabellos y recortes de uña míos, y después le clava agujas. Si yo creo, aunque sea sin convicción, en la eficacia de tal magia y sé que alguien la está empleando contra mí, puedo llegar a sentir dolor en los lugares precisos y enfermar (y en un caso extremo, incluso morir) por efectos psicosomáticos. El éxito ocasional (¡o frecuente!) de la magia simpática en tales casos puede promover la creencia de que tales métodos funcionan, incluso cuando, como en la ceremonia para invocar la lluvia, no puede obtenerse un éxito objetivo, excepto por casualidad.

Volveremos al tema de los modelos acientíficos, y las muchas razones para recurrir a ellos, en el capítulo sobre superstición y escepticismo. Lo que ahora nos interesa es el valor de la teorización científica sobre el mundo que nos rodea, viendo cómo encajan en su justo lugar las conexiones y relaciones observadas.

«Sólo una teoría»

Mucha gente parece tener dificultades con el concepto de teoría, comenzando por la propia palabra, empleada comúnmente con dos significados bastante diferentes. Por un lado, puede significar un sistema coherente de leyes y principios, una explicación más o menos verificada o establecida que da cuenta de hechos o fenómenos conocidos. Por otro, puede referirse a una suposición, una conjetura, una hipótesis no comprobada, una idea o una opinión. Aquí se emplea la palabra en su primera acepción, pero mucha gente, cuando oye hablar de «teoría» o de «teórico», piensa en la segunda. Cuando estudiamos la propuesta de financiación de un proyecto de investigación algo atrevido uno de mis colegas en la junta directiva de la Fundación John D. y Catherine T. MacArthur suele decir: «Creo que deberíamos darle una oportunidad y financiarlo, pero vayamos con cuidado en no gastar dinero en nada teórico». Para un físico teórico profesional, estas palabras deberían resultar una provocación, pero entiendo que mi colega y yo empleamos la palabra «teórico» en sentido diferente.

Teorías sobre topónimos

Puede resultar útil teorizar sobre casi cualquier aspecto del mundo que nos rodea. Consideremos los topónimos como ejemplo. A los habitantes de California, familiarizados con los nombres hispánicos de los pueblos de la costa, no les sorprende que muchos de ellos estén relacionados con la religión católica, de la cual eran devotos practicantes los conquistadores y colonos españoles. No obstante, poca gente se pregunta por qué cada lugar recibió el nombre que tiene. Parece razonable investigar si hay algún proceso sistemático detrás de nombres de santos tales como San Diego, Santa Catalina y Santa Bárbara, así como otros nombres religiosos como Concepción o Santa Cruz, dados a islas, bahías y cabos a lo largo de la costa. Encontramos una pista cuando descubrimos sobre el mapa Punta Año Nuevo. ¿Podrían los otros nombres referirse también a días del año? ¡Naturalmente! En el calendario católico romano encontramos, además del día de año nuevo en el 1 de enero, los siguientes días:

San Diego(San Diego de Alcalá de Henares)12 de noviembre
Santa Catalina(Santa Catalina de Alejandría)25 de noviembre
San Pedro(San Pedro de Alejandría)26 de noviembre
Santa Bárbara(Santa Bárbara, virgen y mártir)4 de diciembre
San Nicolás(San Nicolás de Mira)6 de diciembre
La Purísima Concepción (La Inmaculada Concepción)8 de diciembre

Tal vez, durante un viaje de descubrimiento, estos accidentes geográficos recibieron su nombre según los días del año en el orden en que fueron avistados, de sureste a noroeste. Seguramente, los eruditos han verificado en algún registro histórico que, en 1602, el explorador Sebastián Vizcaíno dio nombre a la bahía de San Diego el 12 de noviembre, a la isla de Santa Catalina el 25 de noviembre, a la bahía de San Pedro el 26 de noviembre, a la bahía de Santa Bárbara el 4 de diciembre, a la isla de San Nicolás el 6 de diciembre y a Punta Concepción el 8 de diciembre. Punta Año Nuevo fue, aparentemente, el primer punto avistado el siguiente año, 1603, aunque fue el 3 de enero en vez del día de año nuevo. El 6 de enero, el día de reyes, Vizcaíno dio nombre a Punta Reyes.

La teoría funciona, pero ¿es general? ¿Qué pasa con Santa Cruz? El día de la Santa Cruz es el 14 de septiembre, lo que no encaja en la secuencia. ¿Recibió el nombre en otra expedición descubridora? El esquema comienza a adquirir algo de complejidad. De hecho, muchos de los nombres religiosos españoles a lo largo de la costa fueron asignados en unas pocas expediciones, de modo que la complejidad efectiva no es tan grande.

En este tipo de teorización (la construcción de un esquema aproximado para describir los resultados de la actividad humana) pueden encontrarse excepciones arbitrarias, que, afortunadamente, no infestan esquemas tales como las ecuaciones de Maxwell para el electromagnetismo. La isla de San Quintín, por ejemplo, situada al norte de San Francisco y conocida por su prisión estatal, parece a primera vista haber recibido su nombre de algún conquistador español el día de San Quintín. Sin embargo, una investigación cuidadosa revela que el «San» fue añadido por error al nombre original de Quintín, un jefe indio capturado allí en 1840.

Teoría empírica: Ley de Zipf

En el ejemplo de los topónimos, la elaboración de una teoría ha conducido no sólo a la identificación de las regularidades presentes, sino también a una explicación plausible y a su posterior confirmación. Es la situación ideal. A menudo, sin embargo, nos encontramos con situaciones menos claras. Podemos hallar regularidades, predecir la aparición de regularidades similares en otras partes, descubrir que las predicciones se confirman e identificar así un modelo sólido; no obstante, puede tratarse de un modelo cuya explicación continúe escapándose. En este caso, hablamos de una teoría

«empírica» o «fenomenológica», pomposas palabras que significan básicamente que vemos que algo sucede, pero no podemos explicarlo. Hay multitud de leyes empíricas que relacionan entre sí hechos de la vida cotidiana.

Tomemos un libro sobre datos estadísticos, como el World Almanac. Hojeándolo, encontraremos una lista de las áreas metropolitanas estadounidenses junto con su número de habitantes en orden decreciente. También encontraremos listas de ciudades de estados individuales, así como de países extranjeros. En cada lista, puede asignarse a cada ciudad un rango, igual a 1 para la ciudad más poblada, 2 para la segunda más poblada, y así sucesivamente. ¿Existe una regla general para todas estas listas que describa cómo disminuye la población a medida que el rango asignado aumenta? Efectivamente, con una buena aproximación, la población es inversamente proporcional al rango asignado; en otras palabras, las sucesivas poblaciones son aproximadamente proporcionales a 1, 1/2, 1/3, 1/4, 1/5, 1/6, 1/7, 1/8, 1/9, 1/10, 1/11, y así sucesivamente.

Echemos ahora un vistazo a la lista de las mayores empresas, en orden decreciente de volumen de negocio (por ejemplo, el importe de las ventas realizadas en un año dado). ¿Hay alguna regla aproximada que nos diga cómo varían con el rango las cifras de ventas de las empresas? Sí, y es la misma ley que para las poblaciones. El volumen de negocio es, de manera aproximada, inversamente proporcional al rango de la empresa.

¿Qué sucede con el valor monetario de las exportaciones anuales de un país determinado en orden decreciente? Aparece de nuevo la misma ley como una buena aproximación.

Una interesante consecuencia de esta ley se puede verificar fácilmente examinando una de las listas mencionadas, por ejemplo la de ciudades y sus poblaciones. En primer lugar, prestemos atención al tercer dígito de la cifra de cada población. Como es de esperar, está distribuido aleatoriamente; los números 0, 1, 2, etc. en la tercera posición se hallan distribuidos aproximadamente por igual. Una situación completamente distinta se obtiene para la distribución de los primeros dígitos. Existe una enorme preponderancia del 1, seguido del 2, y así sucesivamente. El porcentaje de cifras de población que comienzan con un 9 es extremadamente pequeño. Este comportamiento del primer dígito viene predicho por la ley anterior, que si fuese obedecida exactamente daría una proporción de 45 a 1 del 1 respecto del 9.

006.jpg
Figura 6. Poblaciones de ciudades estadounidenses (según datos del 1994 World Almanac) comparadas con la ley de Zipf original y con una versión modificada de ésta.

¿Qué ocurre si dejamos de lado el World Almanac y tomamos un libro de códigos secretos que contenga una lista de las palabras más comunes en cierto tipo de textos en castellano, ordenadas en orden decreciente según la frecuencia con que aparecen? ¿Cuál es la ley aproximada para la frecuencia de cada palabra en función de su posición en la lista? De nuevo encontramos la misma ley, válida también para otros idiomas.

Todas estas relaciones fueron descubiertas en los años treinta por George Kingsley Zipf, un profesor de alemán de Harvard, y todas ellas representan variaciones de lo que actualmente llamamos ley de Zipf. En la actualidad consideramos que la ley de Zipf es uno de los muchos ejemplos de las llamadas leyes de escala o leyes potenciales, comunes en muchas áreas de la física, la biología y las ciencias del comportamiento. Pero en los años treinta estas leyes constituían una novedad.

En la ley de Zipf, la magnitud considerada es inversamente proporcional al rango, es decir, proporcional a 1, 1/2, 1/3, 1/4, etc. Benoit Mandelbrot ha demostrado que se puede obtener una ley potencial más general (casi la más general) sometiendo esta secuencia a dos modificaciones. La primera consiste en añadir una constante al rango, lo que da 1/(1 + constante), 1/(2 + constante), 1/(3 + constante), 1/(4 + constante), etc. La siguiente da cabida, en lugar de estas fracciones, a sus cuadrados, cubos, raíces cuadradas o cualesquiera otras potencias. La elección de los cuadrados, por ejemplo, daría lugar a la siguiente sucesión: 1/(1 + constante)2, 1/(2 + constante)2, 1/(3 + constante)2, 1/(4 + constante)2, etc. La ley de Zipf corresponde a una ley potencial de exponente 1, 2 en el caso de los cuadrados, 3 para los cubos, 1/2 para las raíces cuadradas, etc. Las matemáticas permiten también potencias fraccionarias, como 3/4 o 1,0237. En general, podemos considerar la potencia como 1 más una segunda constante. Tal como se añadía una primera constante al rango, así se suma una segunda a la potencia. La ley de Zipf es entonces el caso particular en que ambas constantes valen cero.

La generalización de Mandelbrot de la ley de Zipf es todavía muy simple: la complejidad adicional reside únicamente en la introducción de las dos constantes ajustables, una sumada al rango y otra a la potencia 1. (Por cierto, una constante ajustable se denomina «parámetro», palabra mal empleada últimamente, tal vez por la influencia de otra palabra similar, «perímetro». La ley potencial modificada tiene dos parámetros.) En cada caso, en lugar de comparar los datos con la ley de Zipf original, uno puede introducir estas dos constantes y determinarlas para que se ajusten óptimamente a los datos. En la tabla de la Figura 6 puede verse cómo una versión ligeramente modificada de la ley de Zipf se ajusta significativamente mejor a unas cifras de población que la ley original (con ambas constantes iguales a cero), la cual funciona ya bien de por sí. «Ligeramente modificada» significa que las nuevas constantes de la ley modificada tienen valores bastante pequeños. (Las constantes para la tabla mencionada se ajustaron por mera inspección de los datos. Un ajuste óptimo habría producido un mejor acuerdo con las poblaciones reales.)

Cuando Zipf describió su ley por primera vez, en una época en que se conocían muy pocas leyes de escala, declaró que su principio distinguía las ciencias de la conducta de las físicas, en las que se suponía que no existían este tipo de leyes. En la actualidad se han descubierto tantas de estas leyes en física que estos comentarios tienden a menoscabar la reputación de Zipf más que a aumentarla. Se dice que había otra causa de su mala fama, a saber, una cierta simpatía por las reordenaciones territoriales europeas por parte de Hitler, simpatía que tal vez justificaba porque las conquistas tendían a modificar las poblaciones europeas de modo que concordaban más exactamente con su ley.

Sea o no cierta, esta historia nos enseña una importante lección acerca de las aplicaciones políticas de las ciencias del comportamiento: el que ciertas relaciones tiendan a darse no significa necesariamente que sean siempre deseables. Me encontré con este mismo problema en un reciente seminario en el Instituto de Aspen, en el que mencioné que ciertas distribuciones de riquezas o ingresos tendían, bajo ciertas condiciones, a seguir leyes de escala. Inmediatamente me preguntaron si tal situación podía considerarse como algo bueno. Según recuerdo, me encogí de hombros. Después de todo, la pendiente de la distribución, que determina el grado de desigualdad en las riquezas o los ingresos, depende de la potencia que se dé en la ley.

La ley de Zipf carece de explicación, y lo mismo puede decirse de la gran mayoría de las otras leyes potenciales. Benoit Mandelbrot, que ha hecho contribuciones realmente importantes al estudio de estas leyes (especialmente en conexión con los fractales), admite con gran franqueza que su carrera científica se ha visto coronada por el éxito debido en gran medida a que siempre ha puesto mayor empeño en hallar y describir nuevas leyes potenciales que en intentar explicarlas. (En su libro La geometría fractal de la naturaleza se refiere a su «inclinación a dar preponderancia a las consecuencias por encima de las causas»). Sin embargo, señala con prontitud que en algunos campos, especialmente las ciencias físicas, se han desarrollado explicaciones bastante convincentes. Por ejemplo, el fenómeno del caos en dinámica no lineal está íntimamente relacionado con los fractales y las leyes potenciales, en una forma bastante bien comprendida. Benoit ha construido también de vez en cuando modelos que exhiben leyes potenciales. Por ejemplo, ha calculado la distribución de frecuencias de longitudes de palabra en los textos tecleados por nuestros monos escritores; se ajusta a una versión modificada de la ley de Zipf, con una potencia que se aproxima a 1 (la ley original) al aumentar el número de símbolos. (También ha descubierto que cuando se ajusta a una ley de Zipf la distribución de frecuencias de longitudes de palabra en los textos reales, escritos en lenguajes naturales, la potencia puede diferir significativamente de 1, con una desviación que depende de la riqueza de vocabulario del texto en cuestión.

Independencia de la escala

En los últimos años se ha progresado en la explicación de ciertas leyes potenciales. Uno de los caminos seguidos es la llamada «criticalidad autoorganizada», concepto propuesto por el físico teórico danés Per Bak, en colaboración con Chao Tang y Kurt Wiesenfeld. La aplicación inicial consistió en el estudio de montones de arena, como los que podemos ver en el desierto o en la playa. Los montones son aproximadamente cónicos, y cada uno tiene una pendiente más o menos bien definida. Si examinamos estas pendientes, descubrimos que casi todas tienen el mismo valor. ¿Cómo se explica? Supongamos que el viento deposita constantemente granos de arena adicionales sobre los montones (o un físico en el laboratorio deja caer grano a grano arena de un depósito sobre un montón experimental). Al crecer el montón, la pendiente lateral aumenta, pero solamente hasta un valor crítico. Una vez que se alcanza esta pendiente crítica, la adición de más arena produce avalanchas que disminuyen la altura del montón.

Si la pendiente es mayor que la crítica, se produce una situación inestable en la que las avalanchas se dan con frecuencia, reduciendo la pendiente hasta que su valor desciende por debajo del crítico. Los montones de arena se ven «atraídos» de modo natural hacia el valor crítico de la pendiente, sin que sea precisa ninguna influencia externa (de aquí el nombre «criticalidad autoorganizada»).

El tamaño de una avalancha se define por el número de granos de arena que participan en ella. La experiencia revela que, cuando el valor de la pendiente está próximo al crítico, los tamaños de las avalanchas siguen con buena aproximación una ley potencial.

En este caso, la constante que hay que añadir a la ley de Zipf es muy grande. En otras palabras, si se asigna un rango numérico a las avalanchas según su tamaño, entonces el número de granos que participan en ellas decrece muy rápidamente con dicho rango. La distribución de las avalanchas en los montones de arena es un ejemplo de ley potencial que ha sido estudiado satisfactoriamente tanto por métodos teóricos como experimentales. Bak y sus colegas reprodujeron, por medio de una simulación numérica, tanto la ley potencial como el valor aproximado de su exponente.

A pesar del fuerte descenso en el tamaño al aumentar el rango asignado, están presentes prácticamente todas las escalas de tamaño de avalancha posibles. En general, una distribución que satisfaga una ley potencial es «independiente de la escala»; por ello, las leyes potenciales se llaman también «leyes de escala». Pero ¿qué significa exactamente que una ley de distribución sea independiente de la escala?

La independencia de la escala de las leyes potenciales queda bien ilustrada por la ley de Zipf original, la cual establece, por ejemplo, que las poblaciones de las ciudades son proporcionales a 1/1 : 1/2 : 1/3 : 1/4 : 1/5 ... Para simplificar, supongamos que corresponden a un millón, medio millón, un tercio de millón, etc. Multipliquemos estas poblaciones por una fracción dada, por ejemplo, 1/2; las nuevas poblaciones, en millones de habitantes, son ahora 1/2, 1/4, 1/6, 1/8, 1/10 ... Son justamente las poblaciones asignadas a los antiguos rangos 2, 4, 6, 8, 10, . De modo que dividir por dos los valores de las poblaciones equivale a doblar los rangos de las ciudades, pasando de la secuencia 1, 2, 3, 4, . a la secuencia 2, 4, 6, 8, 10, . Si representamos gráficamente los nuevos rangos en función de los antiguos, el resultado es una línea recta, como el diagrama mostrado en la Figura 7.

Esta relación lineal entre rangos puede servir como definición de ley de escala para cualquier magnitud: la reducción de todos los valores por cualquier factor constante (1/2 en el ejemplo) equivale a asignar nuevos rangos en el conjunto original de valores, y de ese modo los nuevos rangos son una función lineal de los antiguos. (Los nuevos rangos no serán siempre números enteros, pero en cualquier caso la fórmula para los tamaños en función del rango producirá siempre una curva regular que puede emplearse para interpolar entre números enteros.)

En el caso de las avalanchas en montones de arena, como sus tamaños se distribuyen según una ley potencial, una reducción por cualquier factor común es equivalente a una simple reasignación de los rangos en la secuencia original de avalanchas. Resulta evidente que en dicha ley no se ha seleccionado ninguna escala particular, excepto en los dos extremos del espectro de tamaños, donde aparecen limitaciones obvias. Ninguna avalancha puede incluir menos de un grano de arena y, evidentemente, la ley potencial debe dejar de aplicarse en la escala de un único grano; en el otro extremo del espectro, ninguna avalancha puede ser mayor que la totalidad del montón en cuestión, de modo que a la mayor avalancha posible se le asigna, por definición, rango uno.

Las consideraciones sobre la mayor avalancha posible nos recuerdan una característica común de las distribuciones potenciales de magnitud en sucesos naturales. Los eventos mayores o más catastróficos, con rangos numéricos muy pequeños, pueden considerarse, pese a situarse más o menos en la curva dictada por la ley potencial, como sucesos históricos individuales de los que se derivan consecuencias muy importantes. Por su parte, los sucesos menores, con un rango numérico muy grande, se consideran sólo desde un punto de vista meramente estadístico. Los grandes terremotos, con un índice del orden de 8,5 en la escala de Richter, se recuerdan en los titulares de la prensa y en los libros de historia (especialmente si devastan alguna gran ciudad). Los registros de la multitud de terremotos de índice 1,5 languidecen en las bases de datos de los sismólogos, y su destino es, fundamentalmente, el análisis estadístico. Charles Richter y su maestro Beno Gutenberg, ambos colegas ya fallecidos de Caltech, descubrieron hace ya mucho tiempo que la energía liberada en un terremoto sigue una ley potencial. (Un día de 1933, Gutenberg estaba manteniendo una conversación tan intensa con Einstein sobre sismología que ninguno de los dos percibió el terremoto de Long Beach que sacudió el campus de Caltech.) De igual manera, los pequeños meteoritos que constantemente se estrellan contra la Tierra únicamente se registran en los estudios estadísticos de los especialistas, mientras que el colosal impacto que contribuyó a la extinción masiva del Cretáceo, hace 65 millones de años, está considerado como el suceso individual de mayor importancia en la historia de la biosfera.

Puesto que se ha demostrado que las leyes potenciales operan en los fenómenos de criticalidad autoorganizada, la ya popular expresión «autoorganizado» se está convirtiendo en moneda común, a menudo asociada con el término «emergente». Muchos científicos, entre los que se cuentan miembros de la familia del Instituto de Santa Fe, intentan comprender el fenómeno de la aparición de estructuras sin que medien condiciones especiales impuestas desde el exterior. Estructuras o comportamientos aparentemente complejos pueden surgir en una asombrosa variedad de contextos en el seno de sistemas caracterizados por reglas muy simples. De estos sistemas se dice que son autoorganizados, y sus propiedades, emergentes. El mayor ejemplo es el propio universo, cuya complejidad emerge de un conjunto de leyes simples a las que se suma el azar.

007.jpg
Figura 7. Comportamiento de una ley potencial (en este caso la ley de Zipf original) ante un cambio de escala

En muchos casos, el estudio de estas estructuras se ha visto facilitado en gran medida por el desarrollo de los modernos ordenadores. A menudo resulta más fácil seguir la emergencia de nuevos rasgos por medio de un ordenador que a través de ecuaciones en una hoja de papel. Los resultados son especialmente sorprendentes en aquellos casos en los que la emergencia requiere un gran lapso de tiempo real, pues la computadora puede acelerar el proceso por un factor gigantesco. No obstante, el cálculo por ordenador puede requerir un elevado número de pasos, lo que plantea un problema totalmente nuevo.

Profundidad y cripticidad

En nuestra descripción de la complejidad hemos considerado hasta ahora descripciones comprimidas de un sistema o de sus regularidades (o programas cortos de ordenador que generen descripciones codificadas) y hemos relacionado varias clases de complejidad con la longitud de estos programas o descripciones. No obstante, hemos prestado poca atención al tiempo, al trabajo o al ingenio necesarios para conseguir dicha compresión, o para identificar las regularidades. Como el trabajo de un científico teórico consiste precisamente en reconocer regularidades y en comprimir su descripción en forma de teorías, prácticamente hemos despreciado el valor del trabajo de los teóricos, lo que ciertamente representa un crimen monstruoso. Algo debemos hacer para rectificar ese error.

Ya ha quedado claro que se necesitan varios conceptos diferentes para aprehender convenientemente nuestras nociones intuitivas de complejidad. Ahora necesitamos complementar nuestra definición de complejidad efectiva con la definición de otras magnitudes que describirán el tiempo que emplea un ordenador en pasar de un programa corto a la descripción de un sistema, y viceversa. (Estas cantidades estarán relacionadas hasta cierto punto con la complejidad computacional de un problema, que antes definimos como el mínimo tiempo que tarda un ordenador en resolverlo.)

Estos conceptos relativos a la complejidad han sido objeto de estudio por parte de varios científicos, pero Charles Bennet, un brillante pensador de IBM, los ha tratado de un modo especialmente elegante. Charlie trabaja en IBM, y la empresa le proporciona tiempo para tener ideas, publicarlas y dar seminarios aquí y allá para hablar de ellas. Me gusta comparar sus peregrinaciones con las de los trovadores del siglo XII, que viajaban de corte en corte por lo que ahora es el sur de Francia. En lugar de canciones sobre el amor cortesano, Charlie «canta» sobre complejidad y entropía, ordenadores cuánticos y cifrado cuántico. He tenido el placer de trabajar con él en Santa Fe y en Pasadena, durante una estancia con nuestro grupo en Caltech.

Existen dos magnitudes particularmente interesantes relacionadas con la complejidad computacional, denominadas por Charlie «profundidad» y «cripticidad», con una relación recíproca. El estudio de ambas resulta muy útil en el caso de un sistema aparentemente complejo y que posee no obstante un contenido de información algorítmica y una complejidad efectiva bajos, pues se puede generar su descripción por medio de un programa muy corto. El truco consiste en preguntarse: 1) ¿Cuánto cuesta pasar del programa corto o esquema altamente comprimido a una descripción completamente desarrollada del propio sistema o de sus regularidades? 2) ¿Cuánto cuesta, partiendo del sistema, comprimir su descripción (o una descripción de sus regularidades) en un programa o esquema?

De manera aproximada, la profundidad es una medida del primer tipo de dificultad y la cripticidad del segundo. Evidentemente, el valor asignable al trabajo de un teórico está relacionado con la cripticidad (aunque una descripción más sutil del esfuerzo de elaborar teorías debería incluir una distinción entre el ingenio y la mera laboriosidad).

Un ejemplo hipotético

Para ilustrar cómo una gran simplicidad puede estar asociada con un valor muy grande de la profundidad, retomemos a la conjetura de Goldbach, que afirma que todos los números pares mayores que 2 pueden expresarse como la suma de dos números primos. Como ya se dijo, esta conjetura no ha sido demostrada ni refutada, pero se ha verificado para todos los pares menores que una cierta cota muy grande, merced a la potencia de los ordenadores empleados y a la paciencia de los investigadores.

Previamente nos hemos permitido suponer que la conjetura de Goldbach es técnicamente indecidible (sobre la base de los axiomas de la teoría de números) pero que, de hecho, es cierta en la práctica. Ahora imaginaremos que la conjetura es falsa. En ese caso, existe un número entero par g mayor de 2 y que no puede expresarse como la suma de dos primos. Este número hipotético g tiene una descripción muy simple, justo la que acabamos de dar. Análogamente, existe un programa muy pequeño para calcularlo; por ejemplo, uno puede buscar metódicamente números primos cada vez más grandes y probar la conjetura de Goldbach sobre todos los números desde el 3 hasta el mayor primo hallado. De este modo, podrá descubrirse finalmente el menor número g que viole la conjetura.

Aunque la conjetura de Goldbach sea realmente falsa, es probable que el tiempo de cálculo consumido por tal programa para hallar g sea muy grande de todos modos. En este caso hipotético, el número g tiene un contenido de información algorítmica y una complejidad efectiva pequeños, pero una profundidad considerable.

La profundidad en profundidad

La definición técnica de profundidad propuesta por Charlie implica un ordenador, del mismo tipo que el considerado en relación con el contenido de información algorítmica: un ordenador ideal polifacético al que se le pueda incrementar, en cualquier momento y según las necesidades, la capacidad de memoria (o que tenga de entrada una memoria infinita). Se parte de un mensaje compuesto por una cadena de bits, que describe el sistema objeto de estudio, y se considera no sólo el programa más corto que hará que el ordenador imprima la cadena y se detenga después (como era el caso en la definición de contenido de información algorítmica), sino todo el conjunto de programas cortos que tengan este efecto. Para cada uno de estos programas, se mira cuál es el tiempo de cálculo empleado por el ordenador para pasar del programa a la cadena original y se promedia este valor sobre el conjunto de todos los programas, empleando un método de promedio que da mayor peso a los programas más cortos.

Bennett ha reformulado ligeramente esta definición sirviéndose de la metáfora de Greg Chaitin. Imaginemos que nuestros monos escritores se ponen a trabajar para componer programas de ordenador en lugar de obras en prosa. Prestemos atención a aquellos programas excepcionales que hacen que el ordenador escriba un cierto mensaje y se detenga luego. De entre todos estos programas, ¿cuál es la probabilidad de que el tiempo de ejecución requerido para uno cualquiera de ellos sea menor que un cierto tiempo T? Llamemos p a esta probabilidad. La profundidad d se define entonces como cierto tipo de promedio de los valores posibles de T, promedio que depende de cómo varía p con T.

La Figura 8 representa aproximadamente la variación de la probabilidad p en función del máximo tiempo de ejecución permitido T. Cuando T es muy pequeño, es muy poco probable que los monos compongan un programa que produzca el resultado deseado en tan poco tiempo, de modo que p es cercano a cero. Cuando T es muy grande, la probabilidad se aproxima obviamente a 1. La profundidad d puede definirse, grosso modo, como lo que tarda en subir la curva de T en función de p. La profundidad indica cuál es el máximo tiempo de ejecución permitido que hay que tomar para seleccionar la mayor parte de los programas que harán que el ordenador imprima nuestro mensaje y después se detenga. La profundidad es en cierto modo una medida del tiempo que tardará en generarse el mensaje.

008.jpg
Figura 8 La profundidad como función creciente del tiempo

En la naturaleza, el hecho de que un sistema posea una profundidad muy grande nos indica que ha tardado mucho tiempo en evolucionar o bien que tiene su origen en otro sistema al cual le ha llevado mucho tiempo evolucionar a su vez. La gente que muestra interés en la conservación de la naturaleza o en la preservación de monumentos históricos está intentando de hecho preservar la profundidad y la complejidad efectiva, tal como se manifiestan en las comunidades naturales o en la cultura humana.

Pero, como ha demostrado Charlie, la profundidad tiende a manifestarse como el subproducto de un proceso evolutivo prolongado Podemos encontrar muestras de profundidad no sólo en las formas de vida actuales, incluido el hombre, en las magníficas obras de arte producidas por la humanidad o en los restos fósiles de dinosaurios mamíferos de la Era Glacial, sino también en una lata de cerveza vacía abandonada en una playa, o en una pintada sobre la pared de un cañón. Los conservacionistas no están obligados a defender toda las manifestaciones de profundidad.

Profundidad y contenido de información algorítmica

Aunque la profundidad es un promedio de tiempos de ejecución sobre longitudes de programa, promedio realizado de modo que los programas más cortos tengan mayor peso, podemos en muchos casos hacernos una idea de su valor considerando el tiempo de ejecución del programa más corto. Supongamos, por ejemplo, que la cadena de bits de nuestro mensaje es completamente regular, con un contenido de información algorítmica casi nulo. El tiempo de ejecución del programa más corto en este caso es bastante reducido —el ordenador no ha de «pensar» mucho para ejecutar un programa como «IMPRIME veinte billones de ceros» (aunque si la impresora es lenta la impresión puede llevar algún tiempo). Si el contenido de información algorítmica es muy bajo, la profundidad es pequeña.

¿Qué ocurre con una cadena aleatoria, con un máximo contenido de información algorítmica para una longitud de mensaje dada? Pasar del programa más corto —IMPRIME seguido de la propia cadena— a la impresión efectiva del mensaje no requerirá tampoco demasiado esfuerzo por parte del ordenador, de modo que cuando el contenido de información algorítmica es máximo la profundidad es igualmente baja. La situación recuerda la variación de la complejidad efectiva máxima con el contenido de información algorítmica, como se representa en la Figura 4. En este caso podemos entender cómo varía la profundidad máxima con el contenido de información algorítmica. Su valor es bajo en ambos extremos, pero puede tener un valor finito entre estos puntos, en la región intermedia entre el orden y el desorden. Naturalmente, en esta región intermedia la profundidad no tiene por qué ser grande.

009.jpg
Figura 9. Máxima profundidad posible representada como Junción aproximada del contenido de infamación algorítmica

La figura precedente tiene una forma distinta de la correspondiente a la Figura 4; aunque ambas son representaciones aproximadas, muestran que la profundidad puede ser grande incluso para valores del contenido de información algorítmica muy cercanos al orden o al desorden completos, donde la complejidad efectiva es también pequeña.

Cripticidad y teorización

La definición de cripticidad hace referencia a una operación que es la inversa de la que se considera en la definición de profundidad. La cripticidad de la cadena de bits de un mensaje es el menor tiempo requerido por un ordenador estándar para encontrar, partiendo de la cadena, uno de los programas más cortos que hagan que la máquina imprima el mensaje y después se detenga.

Supongamos que la cadena de bits es el resultado de la codificación del flujo de datos estudiado por un teórico. La cripticidad de la cadena sería entonces una medida aproximada de la dificultad de la tarea del teórico, no muy diferente de la del ordenador en la definición. El teórico identifica tantas regularidades como puede, en forma de información mutua que relaciona diferentes partes del flujo de datos, y luego elabora hipótesis, tan simples y coherentes como le sea posible, que expliquen las regularidades observadas.

Las regularidades son los rasgos comprimibles del flujo de datos. Proceden en parte de las leyes fundamentales de la naturaleza y en parte de sucesos azarosos que pudieron ocurrir de otra forma. Pero el flujo posee también rasgos aleatorios, procedentes de sucesos azarosos que no dieron lugar a regularidades; estos rasgos son incomprensibles. Al comprimir las regularidades tanto como sea posible, el teórico está descubriendo al mismo tiempo una descripción concisa de la totalidad del flujo, compuesta de regularidades comprimidas y de información aleatoria suplementaria incompresible. Análogamente, un programa breve que haga que el ordenador imprima el mensaje (y luego se detenga) puede modificarse para que consista en un programa básico que describa las regularidades de la cadena más una parte adicional que aporte información sobre sus circunstancias específicas accidentales.

Aunque nuestras disquisiciones sobre el concepto de teoría apenas han arañado la superficie de este tema, hemos mencionado ya la teorización sobre los topónimos, sobre fórmulas empíricas en estadística, sobre la altura de los montones de arena y sobre el electromagnetismo clásico y la gravitación. Aunque hay una gran similaridad formal entre estas diversas clases de teorización, cada una implica descubrimientos en muchos niveles diferentes, entre los que resulta útil hacer una distinción. ¿Se están estudiando las leyes básicas de la física? ¿O leyes aproximadas aplicadas a objetos físicos desordenados como los montones de arena? ¿O leyes empíricas, generales aunque aproximadas, sobre instituciones humanas, como ciudades o compañías financieras? ¿O reglas específicas, cargadas de excepciones, sobre los nombres que la gente aplica a una región geográfica determinada? Existen claras e importantes diferencias en exactitud y generalidad entre toda esta diversidad de principios teóricos. Esas diferencias se discuten frecuentemente en términos de cuáles son más fundamentales que los demás. Pero ¿qué significa esto?

Capítulo 9
¿Qué es lo fundamental?

El quark y el jaguar se encuentran prácticamente en los extremos opuestos de la escala de lo fundamental. La física de las partículas elementales y la cosmología son las dos disciplinas científicas más básicas, mientras que el estudio de la materia viva altamente compleja es mucho menos básico, aunque obviamente de la mayor importancia. A fin de discutir esta jerarquía de las ciencias, es necesario desenredar al menos dos ovillos distintos, uno de los cuales tiene que ver con convenciones y el otro con las afinidades reales entre las diferentes materias.

Una vez me contaron que la facultad de ciencias de una universidad francesa solía tratar los asuntos relativos a sus diversas cátedras en un orden fijo: primero las matemáticas, y después la física, la química, la fisiología, etc. Cabe pensar que los asuntos de los biólogos debían de estar bastante desatendidos.

Igualmente, en el testamento de Alfred Nobel, el magnate sueco de la dinamita que estableció los premios que llevan su nombre, los premios científicos están ordenados con la física en primer lugar, la química en segundo, y la medicina y fisiología en tercero. Debido a ello, el premio de física es el primero en entregarse al comenzar la ceremonia en Estocolmo. Si sólo hay un galardonado y se trata de un hombre casado, su mujer acude del brazo del rey a la cena que se celebra más tarde (cuando mi amigo Abdus Salam, paquistaní musulmán, compartió el Nobel de física en 1979, se presentó en Suecia con sus dos esposas, provocando no pocos problemas de protocolo). El ganador o ganadores del Nobel de química ocupan el segundo lugar en el protocolo, y los de medicina y fisiología el tercero. Las matemáticas no fueron incluidas en el testamento de Nobel por razones algo oscuras. Un persistente rumor afirma que Nobel estaba enemistado con un matemático sueco, Mittag-Leffler, por el amor de una mujer, pero, por lo que sé, no es más que una leyenda.

El origen de esta jerarquía en las ramas de la ciencia puede situarse en el trabajo del filósofo decimonónico francés Auguste Comte, quien sostuvo que la astronomía era la disciplina científica fundamental, la física la segunda, etc. (consideraba la matemática más como un útil lógico que como una auténtica ciencia). ¿Estaba en lo cierto? Y si es así, ¿en qué sentido? Llegados a este punto, hay que dejar de lado las cuestiones de prestigio e intentar comprender qué significa realmente esta jerarquía en términos científicos.

El carácter especial de la matemática

En primer lugar, es cierto que la matemática no es realmente una ciencia, si por ciencia entendemos una disciplina dedicada a la descripción de la naturaleza y de sus leyes. La matemática se ocupa de demostrar las consecuencias lógicas de determinados conjuntos de suposiciones. Se puede por tanto omitir de la lista de las ciencias (como hizo Nobel) y considerarla tanto una materia interesante por derecho propio (matemática pura) como una herramienta extremadamente útil para las ciencias (matemática aplicada).

Otra manera de enfocar el asunto consiste en considerar la matemática aplicada como el estudio de todas aquellas estructuras que se dan en las teorías científicas, mientras que la matemática pura cubre no sólo éstas, sino todas aquellas que podrían haberse dado (o podrían darse en el futuro). La matemática se convierte así en el estudio riguroso de mundos hipotéticos. Desde este punto de vista, la matemática es una clase de ciencia, la ciencia de lo que es y de lo que podría haber sido.

Considerada de esta forma, ¿es la matemática la más fundamental de las ciencias? En cuanto a las otras disciplinas ¿qué significa la afirmación de que la física es más fundamental que la química, o la química más que la biología? ¿Qué pasa con las diferentes partes de la física: son algunas más fundamentales que las otras? En general, ¿qué es lo que hace que una ciencia sea más fundamental que otra?

Sugiero que la ciencia A tiene un carácter más fundamental que la ciencia B cuando:

  1. Las leyes de la ciencia A abarcan los fenómenos y leyes de la ciencia B.
  2. Las leyes de la ciencia A son más generales que las de la ciencia B (es decir, las propias de B son válidas bajo unas condiciones más restrictivas que las de A).

Si consideramos la matemática como una ciencia, entonces, de acuerdo con estos criterios, ésta tiene un carácter evidentemente más fundamental que cualquier otra. Todas las estructuras matemáticas concebibles entran dentro de su esfera, mientras que las útiles para describir fenómenos naturales representan sólo un pequeño subconjunto de aquellas que son, o serán, estudiadas por los matemáticos. Este subconjunto de leyes matemáticas cubre todas las teorías empleadas en las demás ciencias. Pero ¿qué sucede con estas otras ciencias? ¿Cuáles son las relaciones entre ellas?

La física del electrón y la química

Se dice que en 1928, cuando publicó su ecuación mecanocuántica relativista para el electrón, el destacado físico teórico inglés Paul Adrien Maurice Dirac declaró que su fórmula explicaba la mayor parte de la física y toda la química. Naturalmente, era una exageración. No obstante, se puede entender lo que quería decir, especialmente en lo referente a la química, que estudia principalmente el comportamiento de átomos y moléculas, compuestos a su vez por un núcleo masivo rodeado de electrones ligeros que se mueven a su alrededor. Casi todos los fenómenos químicos están gobernados en gran medida por el comportamiento de los electrones, que interactúan entre sí y con el núcleo a través de fuerzas electromagnéticas.

La ecuación de Dirac, que describe la interacción del electrón con el campo electromagnético, dio lugar en pocos años a la eclosión de la teoría mecanocuántica relativista del electrón y el electromagnetismo. Esta teoría, la electrodinámica cuántica, abreviada QED (del inglés quantum electrodynamics), ha sido verificada experimentalmente con enorme precisión repetidas veces (y merece por ello la abreviatura, que a algunos nos recuerda aquellos días de escuela en que al final de una demostración matemática poníamos las siglas latinas «QED» para indicar quod erat demonstrandum, «lo que se quería demostrar»).

La QED explica, en principio, una gran parte de la química. Puede aplicarse rigurosamente a todos aquellos problemas en que los núcleos pesados pueden aproximarse por partículas puntuales cargadas e inmóviles. Extensiones simples de la QED permiten incorporar también el movimiento del núcleo y su tamaño finito.

En principio, un físico teórico que trabaje con la QED puede determinar el comportamiento de cualquier sistema químico en el que la estructura interna del núcleo atómico no sea importante. Los cálculos sobre estos procesos químicos, que se valen de aproximaciones válidas de la QED, predicen satisfactoriamente los resultados experimentales. De hecho, hay una aproximación particular bien justificada de la QED que producirá buenos resultados en la mayoría de casos; es la llamada ecuación de Schrödinger con interacciones culombianas, aplicable cuando el sistema es «no relativista», es decir, cuando electrones y núcleos se mueven con velocidades muy pequeñas comparadas con la de la luz. Esta aproximación fue descubierta en los primeros días de la revolución cuántica, tres años antes de la aparición de la ecuación relativista de Dirac.

Para que de las teorías físicas fundamentales se deriven propiedades químicas es preciso, por así decirlo, formular preguntas de química a la física. Deben introducirse en los cálculos no sólo las ecuaciones básicas, sino también las condiciones que caracterizan el sistema o proceso químico en cuestión. Tenemos, por ejemplo, que el estado de mínima energía de dos átomos de hidrógeno es la molécula de hidrógeno H2. Una cuestión importante en química es la energía de enlace de esta molécula, es decir, la diferencia entre la energía de la molécula y la suma de las energías de los dos átomos individuales que la componen. Una vez planteada, la respuesta a esta pregunta puede obtenerse por medio de la QED. Pero es necesario «preguntar a la ecuación» cuáles son las propiedades del estado de mínima energía de esa molécula en particular.

Las condiciones de baja energía en que surgen estas cuestiones químicas no son universales. En el centro del sol, donde reina una temperatura de decenas de millones de grados, los átomos de hidrógeno se disgregan en sus electrones y protones constituyentes. Ni átomos ni moléculas están presentes allí en cantidades apreciables. Se puede decir que la química no existe en el centro del sol.

La QED satisface los dos criterios que permiten considerarla más fundamental que la química: las leyes de la química son derivables, en principio, de las de la QED, siempre que se suplementen las ecuaciones con información adicional que describa las condiciones químicas adecuadas, y por otra parte, estas condiciones son especiales, no son válidas en todo el universo.

La química en su propio nivel

Aun con la ayuda de los mayores y más rápidos ordenadores disponibles en la actualidad, a partir de la teoría física básica sólo son abordables los problemas químicos más simples. El número de problemas tratables está creciendo, pero la mayoría de procesos químicos se describe todavía haciendo uso de ideas, conceptos y fórmulas propios de la química.

En general, los científicos suelen desarrollar teorías para describir resultados observados en un campo particular sin derivarlos de las teorías de un campo más fundamental. Tal derivación, aunque en principio resulta posible si se suministra la información adicional necesaria, es en la mayor parte de casos muy difícil o imposible de llevar a la práctica.

Por ejemplo, los químicos diferencian varios tipos de enlace entre átomos (un ejemplo es el enlace entre los dos átomos de la molécula de hidrógeno). En el curso de su experiencia, han desarrollado numerosas ideas prácticas sobre el enlace químico que les permiten realizar predicciones sobre el comportamiento de las reacciones químicas. Al mismo tiempo, los químicos teóricos intentan derivar esas ideas, en la medida de lo posible, de aproximaciones de la QED. Salvo en los casos más simples, su propósito sólo se ha visto parcialmente coronado por el éxito, pero no albergan dudas de que en principio, con la suficiente potencia de cálculo, podrían alcanzar su objetivo con gran precisión.

Escaleras (o puentes) y reducción

Nos vemos así abocados a la metáfora común de los diferentes niveles de la ciencia, con los más fundamentales en la base y los menos en la cima. La química no nuclear ocupa un nivel «por encima» de la QED. En casos muy simples se puede emplear una aproximación de la QED para realizar predicciones directas en el nivel químico, pero en la mayoría de casos las leyes se formulan en el nivel superior (químico) para explicar y predecir fenómenos en ese mismo nivel, y más tarde se intenta derivar esas leyes, en la medida de lo posible, del nivel inferior (la QED). La ciencia se desarrolla en ambos niveles, a la vez que se intenta construir escaleras (o puentes) entre ambos.

No es necesario restringir la discusión a los fenómenos no nucleares. Desde su desarrollo en los años treinta la QED ha sido ampliamente generalizada, y ha dado lugar a toda una nueva disciplina, la física de las partículas elementales. La teoría de las partículas elementales, en la que he trabajado casi toda mi vida, se ocupa de la descripción de todas las partículas elementales (las piezas básicas con que está construida la materia) y de todas las fuerzas de la naturaleza, no únicamente de los electrones y el electromagnetismo. La teoría de las partículas elementales describe el comportamiento de los electrones y lo que ocurre en el interior del núcleo atómico. Por lo tanto, la relación entre la QED y la parte de la química que se ocupa de los electrones puede considerarse como un caso especial de la relación entre la física de las partículas elementales (en conjunto) en el nivel más fundamental, y la química (también en conjunto, incluyendo la química nuclear) en el nivel menos fundamental.

La explicación del nivel superior en términos del inferior se suele denominar «reducción». No sé de ningún científico serio que crea en la existencia de fuerzas químicas especiales que no puedan explicarse a partir de las interacciones físicas subyacentes. Aunque a algunos químicos no les guste verlo así, lo cierto es que la química podría derivarse, en principio, de la física de las partículas elementales. En este sentido todos somos reduccionistas, al menos en lo referente a la química y la física. Pero, dado que al aplicarse únicamente bajo ciertas condiciones particulares que permiten la existencia de fenómenos químicos, la química es más restringida que la física de las partículas elementales, es necesario introducir en las ecuaciones de la física de partículas la información concerniente a esas condiciones para poder derivar, al menos en teoría, las leyes de la química. Sin estas consideraciones, la noción de reducción resulta incompleta.

De todo esto se desprende una lección útil, y es que, aunque las diferentes ciencias residen efectivamente en diferentes niveles, forman parte de una única estructura conexa. La unicidad de esta estructura está basada en las relaciones entre las partes. Una ciencia perteneciente a un nivel determinado abarca las leyes de otra ciencia menos fundamental, situada en un nivel superior. Pero esta última, al ser especial, precisa de información adicional además de las leyes del nivel inferior. En cada nivel hay leyes por descubrir, importantes por sí mismas. El desarrollo de la ciencia implica investigar esas leyes a todos los niveles, a la vez que se trabaja, de arriba abajo, en la construcción de escaleras entre ellos.

Estas consideraciones se aplican también dentro de la física. Las leyes de la física de partículas son válidas para toda la materia, en todo el cosmos, bajo cualesquiera condiciones. No obstante, en los primeros instantes de la expansión del universo la física nuclear no era de hecho aplicable, pues la densidad era demasiado elevada para permitir la existencia de núcleos aislados, o incluso de neutrones o protones. Aun así, la física nuclear es crucial para comprender qué sucede en el centro del sol, donde reacciones termonucleares (similares a las que tienen lugar dentro de una bomba de hidrógeno) liberan la energía que emite el astro, aunque las condiciones allí sean demasiado extremas como para que exista la química.

La física de la materia condensada, que se ocupa de sistemas tales como vidrios, cristales y líquidos, o superconductores y semiconductores, es una disciplina muy restringida, aplicable únicamente bajo condiciones que permitan la existencia de las estructuras objeto de su estudio (como, por ejemplo, temperaturas suficientemente bajas). Para poder derivarla, teóricamente, a partir de la física de partículas, es necesario también especificar las condiciones en que se aplica.

La información necesaria para la reducción de la biología

¿Qué se puede decir de la relación entre la física y la química y otro nivel jerárquico, el de la biología? ¿Existen todavía, como era común en épocas pasadas, biólogos serios que crean en la existencia de «fuerzas vitales» que no tengan un origen fisicoquímico? Deben ser muy pocos, si es que queda alguno. Todos estamos virtualmente convencidos de que la vida se fundamenta en las leyes de la física y la química, tal como las leyes de la química surgen de las de la física, y en este sentido todos somos de alguna manera reduccionistas. Sin embargo, como ocurre con la química, sigue siendo muy provechoso estudiar la biología en sus propios términos y en su propio nivel, mientras prosigue la construcción de la escalera.

Por otra parte, la biología terrestre es una ciencia extremadamente particular, pues se ocupa de las formas de vida de este planeta, que pueden resultar muy diferentes de los otros sistemas complejos adaptativos que seguramente existen en planetas girando en torno a estrellas distantes. En algunos de estos planetas tal vez no describiríamos como seres vivos a los sistemas complejos adaptativos que allí encontrásemos (para tomar prestado un ejemplo trivial de la ciencia ficción, imaginemos una sociedad compuesta de robots y ordenadores muy avanzados, descendientes de otros construidos largo tiempo atrás por una raza extinguida de seres que sí habríamos descrito como «vivos»). Incluso si nos limitamos a los seres propiamente vivos, muchos de ellos presumiblemente exhibirían propiedades muy distintas de los de la Tierra. Es necesario aportar una enorme cantidad de información específica adicional, por encima de las leyes de la física y la química, para caracterizar los fenómenos biológicos terrestres.

Para empezar, es probable que muchos de los rasgos comunes que caracterizan cualquier forma de vida en la Tierra sean el resultado de accidentes ocurridos al principio de la historia de la vida sobre el planeta, accidentes que pudieron haber tenido un resultado diferente (formas de vida para las cuales estos accidentes tuvieron un resultado distinto quizá existieron sobre la Tierra hace mucho tiempo). Incluso la regla de que los genes deben estar compuestos por cuatro nucleótidos, denominados abreviadamente A, C, G y T, que parece regir para toda la vida actual en nuestro planeta, podría no ser universal a escala cósmica. Puede haber muchas otras reglas posibles válidas en otros planetas, y seres que obedeciesen estas otras reglas podrían haber poblado la Tierra hace miles de millones de años, hasta que perdieron la batalla contra la vida basada en los nucléotidos ahora familiares y desaparecieron.

Bioquímica: Complejidad efectiva frente a profundidad

No sólo el conjunto particular de nucleótidos que caracteriza el ADN de la vida terrestre puede resultar o no único; la misma cuestión se plantea respecto de todas las propiedades generales que caracterizan la química de la vida en la Tierra. Algunos teóricos proclaman que la bioquímica debe tomar formas diferentes en los distintos planetas dispersos por el universo. El caso de la Tierra sería sólo el resultado de una larga sucesión de sucesos azarosos, cada uno de los cuales habría contribuido a las notables peculiaridades de la bioquímica terrestre, proporcionándole así una gran cantidad de complejidad efectiva.

En el otro extremo están quienes creen que la bioquímica es esencialmente única, y que las leyes de la química, basadas en las leyes más fundamentales de la física, dejan muy pocas posibilidades para otra química de la vida diferente de la observada en la Tierra. Los defensores de este punto de vista afirman que el paso de las leyes fundamentales a las de la bioquímica no implica de hecho ninguna información adicional, y que contribuye muy poco al aumento de la complejidad efectiva. No obstante, un ordenador tendría que hacer una enorme cantidad de cálculos para deducir, a partir de las leyes fundamentales de la física, la cuasiunicidad de la bioquímica como proposición teórica. En cualquier caso, la bioquímica seguiría poseyendo una gran profundidad, aunque no tuviese una gran complejidad. Otra forma de presentar la cuestión sobre la cuasiunicidad de la bioquímica terrestre consiste en preguntarse si la biología depende principalmente de plantear las cuestiones físicas correctas, o si también la historia tiene un papel importante.

La vida: Alta complejidad efectiva entre el orden y el desorden

Aunque la química propia de la vida terrestre dependa en poca medida de la historia, todavía queda una enorme cantidad de complejidad efectiva dentro de la biología, mucha más que en la química o la física de la materia condensada. Consideremos el inmenso número de cambios evolutivos aleatorios acaecidos durante los cuatro mil millones de años transcurridos desde el origen de la vida en la Tierra. Algunos de estos accidentes (probablemente un pequeño porcentaje, pero aun así muchos) han desempeñado papeles capitales en la subsiguiente historia de la vida en este planeta y en las características de las diferentes formas de vida que pueblan la biosfera. Las leyes de la biología dependen de las leyes de la física y la química, pero también de una ingente cantidad de información adicional acerca del resultado de aquellos accidentes. En este caso —y con mucha más razón que para la física nuclear, la física de la materia condensada o la química— puede observarse la gran diferencia entre la clase de reducción que es posible en principio en biología y la idea trivial que la palabra «reducción» despertaría en la mente de un lector ingenuo. La ciencia de la biología es mucho más compleja que las leyes fundamentales de la física porque gran parte de las regularidades que se observan en la biología terrestre proceden tanto de sucesos casuales como de dichas leyes.

El estudio de los sistemas complejos adaptativos de cualquier clase y sobre cualquier planeta no deja de ser bastante singular. El medio ambiente debe presentar una regularidad suficiente, que el sistema explotará para aprender o adaptarse, pero, al mismo tiempo, esa regularidad no debe ser tanta como para que no suceda nada en absoluto. Si el ambiente en cuestión es, por ejemplo, el centro del sol, a una temperatura de decenas de millones de grados, reina en él un estado de total aleatoriedad, con un contenido de información algorítmica casi máximo, y no hay lugar para la complejidad efectiva o para la profundidad —no puede existir nada parecido a la vida—. Tampoco puede darse la vida si el medio ambiente es un cristal perfecto a una temperatura de cero absoluto, con un contenido de información algorítmica prácticamente nulo y escasas posibilidades para la complejidad efectiva o la profundidad. Para que un sistema complejo adaptativo pueda funcionar se requieren condiciones intermedias entre el orden y el desorden.

La superficie del planeta Tierra proporciona un medio ambiente con un contenido de información algorítmica intermedio, en el que puede haber complejidad efectiva y profundidad; ésta es una de las razones por las que la vida ha podido evolucionar aquí. Naturalmente, en un principio, bajo las condiciones que imperaban en la Tierra hace miles de millones de años, sólo se desarrollaron formas de vida muy primitivas. Pero, posteriormente, estos mismos seres vivos alteraron la biosfera, en particular al enriquecer en oxígeno la atmósfera, produciendo condiciones similares a las actuales y permitiendo la evolución de formas de vida superiores, con una organización más compleja. Las condiciones intermedias entre el orden y el desorden absolutos caracterizan el medio ambiente en que puede darse la vida, y también la propia vida, con su alta complejidad efectiva y gran profundidad.

Psicología y neurobiología: La mente y el cerebro

Los sistemas complejos adaptativos en la Tierra han dado origen a varios niveles de ciencia situados «por encima» de la biología. Uno de los más importantes es el estudio de la psicología animal, especialmente la del animal de más compleja psicología, el ser humano. De nuevo, puede que haya algún raro científico contemporáneo que crea en la existencia de «fuerzas mentales» de origen no biológico y, en última instancia, no fisicoquímico, pero virtualmente todos somos, en este sentido, reduccionistas. Aún así, a veces, en conexión con disciplinas como la psicología (y también la biología), la palabra «reduccionista» tiene un carácter peyorativo, incluso entre científicos. (Por ejemplo, el Instituto Tecnológico de California, en el que he enseñado durante casi cuarenta años, es a menudo tachado de «reduccionista»; de hecho, yo mismo he empleado el término para condenar lo que considero serias deficiencias de nuestro Instituto.) Ahora bien, ¿sobre qué se discute en realidad?

La cuestión es que el estudio de la psicología —aunque resulte sin duda derivable de la neurofisiología, la endocrinología de los neurotransmisores, etc.— es valioso en su propio nivel. Muchos, yo entre ellos, creen que cuando se hayan construido las escaleras entre la psicología y la biología, la mejor estrategia será trabajar tanto desde arriba como desde abajo. Es esta proposición la que no goza de aceptación universal, por ejemplo en Caltech, donde virtualmente no hay investigación sobre psicología humana.

Allí donde se trabaja en biología y psicología, así como en la construcción de las escaleras entre ambas disciplinas, el énfasis en el lado biológico recae sobre el cerebro (junto con el resto del sistema nervioso, el sistema endocrino, etc.), mientras que en el lado psicológico recae sobre la mente —es decir, el conjunto de manifestaciones fenomenológicas del funcionamiento del cerebro y otros órganos relacionados—. Cada tramo de escalera es un puente entre el cerebro y la mente.

En Caltech, gran parte de la investigación en esta área está dedicada al cerebro. La mente está descuidada y, en algunos círculos, la propia palabra «mente» resulta sospechosa (un amigo mío la llama la palabra M). No obstante, no hace mucho se llevaron a cabo en Caltech importantes investigaciones psicológicas, en especial los trabajos del psicobiólogo Roger Sperry y sus colaboradores sobre las correlaciones mentales entre los hemisferios izquierdo y derecho del cerebro humano. Estudiaron pacientes cuyo cuerpo calloso —una parte del cerebro que conecta ambos hemisferios— había sido seccionado a consecuencia de un accidente o de un tratamiento quirúrgico contra la epilepsia. Se sabía que el habla y el control del lado derecho del cuerpo están asociados al hemisferio izquierdo, mientras que el lado izquierdo del cuerpo se halla asociado al hemisferio derecho. En sus investigaciones hallaron que un paciente con el cuerpo calloso seccionado era incapaz de expresar verbalmente información adquirida por el lado izquierdo de su cuerpo, a la vez que mostraba evidencias indirectas de poseer tal información.

Al disminuir con la edad la actividad de Sperry, las investigaciones que inició las prosiguieron en otros centros sus antiguos colaboradores y otros muchos científicos nuevos en este campo. Se hallaron nuevas evidencias de que el hemisferio izquierdo está relacionado con el habla, así como con la lógica y el análisis, mientras que el hemisferio derecho está asociado con la comunicación no verbal, los aspectos afectivos del lenguaje y las funciones integrativas, como el reconocimiento de caras. Algunos científicos han llegado a relacionar el hemisferio derecho con la intuición y la percepción de cuadros generales. Desafortunadamente, la divulgación popular ha exagerado y distorsionado muchos de los resultados obtenidos, y en la polémica desatada se ha ignorado en gran medida la advertencia de Sperry de que «los dos hemisferios de un cerebro normal intacto tienden regularmente a funcionar en coordinación, como una unidad...». No obstante, los descubrimientos realizados son realmente notables. A mí me intriga particularmente saber hasta qué punto es cierta la afirmación de que los aficionados perciben usualmente la música con su hemisferio derecho, mientras que los músicos profesionales lo hacen principalmente con su hemisferio izquierdo.

Concentración en el mecanismo o en la explicación: «Reduccionismo»

¿Por qué en la actualidad se realiza tan poca investigación psicológica en Caltech? Por supuesto, es un centro pequeño y en él no se puede hacer de todo. Pero ¿por qué tan poca biología evolutiva? (A veces digo, bromeando, que si fuéramos una institución creacionista, apenas tendríamos menos.) ¿Por qué tan poca ecología, lingüística o arqueología? Uno llega a sospechar que todas ellas tienen algo en común que desconcierta a nuestro claustro.

Los programas de investigación científica en Caltech tienden a favorecer el estudio de mecanismos, procesos subyacentes y explicaciones. Naturalmente simpatizo con estos fines, porque son los propios de la física de partículas elementales. De hecho, el énfasis en los mecanismos subyacentes ha conducido a impresionantes logros en multitud de campos. En los años veinte, T. H. Morgan fue invitado a fundar la división de biología mientras se hallaba secuenciando los genes de la mosca de la fruta, sentando así las bases de la genética moderna. Max Delbrük, que ingresó en los años cuarenta, se convirtió en uno de los fundadores de la biología molecular.

Pero si una disciplina se considera demasiado descriptiva y fenomenología, no situada todavía en el nivel en que sus mecanismos pueden estudiarse, nuestro claustro la considera insuficientemente «científica». Si Caltech hubiese existido en la época de Darwin, con estas mismas inclinaciones, ¿le hubiesen invitado a él a unirse al claustro? Después de todo, Darwin formuló su teoría de la evolución sin muchas pistas sobre sus procesos fundamentales. Sus escritos indican que, si le hubieran presionado para explicar los mecanismos de variación, probablemente hubiese optado por una explicación de tipo lamarckiano (los lamarckianos pensaban que cortando la cola a ratones durante varias generaciones se obtendría una cepa de ratones rabones, o que los largos cuellos de las jirafas se debían a generaciones de antepasados que se pasaban el día estirándolos para alcanzar ramas de acacia más altas). Sin embargo, su contribución a la biología resultó monumental. En particular, su teoría de la evolución sentó las bases para el principio unificador de que todos los organismos existentes proceden de un único ancestro. Qué contraste con la complejidad de la noción antes imperante de la estabilidad de las especies, que afirmaba que cada una de ellas había sido creada por medios sobrenaturales.

Aunque yo estuviera de acuerdo en que disciplinas como la psicología no son todavía lo suficientemente científicas, mis preferencias se decantarían por abordarlas y disfrutar así del placer de hacerlas más científicas. Además de favorecer, como regla general, la construcción de escaleras interdisciplinarias —partiendo de lo más fundamental hacia lo menos fundamental—, yo me mostraría, en el caso de la psicología y en otros muchos, partidario de una aproximación de arriba abajo, que comenzase con la identificación de las principales regularidades en el nivel menos fundamental y dejase para más tarde el conocimiento de los mecanismos fundamentales subyacentes. Pero la atmósfera del campus de Caltech está impregnada de una fuerte propensión a abordar los problemas desde abajo, lo que ha propiciado la mayor parte de los espectaculares logros responsables de la reputación del centro. Es también esta propensión la que invita a acusarlo de reduccionismo, con sus connotaciones peyorativas.

Las disciplinas como la psicología, la biología evolutiva, la ecología, la lingüística y la arqueología, trabajan con sistemas complejos adaptativos. Todas ellas son objeto de estudio en el Instituto de Santa Fe, donde se da un gran énfasis a las semejanzas entre estos sistemas y a la importancia de estudiarlos en sus propios niveles, no meramente como consecuencias de otras disciplinas científicas más fundamentales. En este sentido el Instituto de Santa Fe forma parte de una revolución en contra del exceso de reduccionismo.

Simplicidad y complejidad entre el quark y el jaguar

Aunque considero que Caltech está cometiendo un grave error al despreciar la mayoría de las «ciencias de la complejidad», me satisface el soporte que proporciona a la física de partículas y a la cosmología, las ciencias más fundamentales de todas, dedicadas a la búsqueda de las leyes básicas del universo.

Uno de los grandes desafíos de la ciencia contemporánea es el explorar la mezcla de simplicidad y complejidad, regularidad y aleatoriedad, orden y desorden, escaleras arriba desde la física de partículas y la cosmología hasta el reino de los sistemas complejos adaptativos. Tenemos que comprender la manera en que surgieron, a partir de la simplicidad, el orden y la regularidad del universo primigenio, las condiciones intermedias entre orden y desorden que han prevalecido en muchos lugares en épocas posteriores, y que han hecho posible, entre otras cosas, la existencia de sistemas complejos adaptativos como los seres vivos.

A este fin, tenemos que examinar la física fundamental desde la perspectiva de la simplicidad y la complejidad, e interrogamos sobre el papel desempeñado por la teoría unificada de las partículas elementales, las condiciones iniciales del universo, la indeterminación de la mecánica cuántica y las incertidumbres de la teoría clásica del caos, en la producción de los patrones de regularidad y aleatoriedad universales que han permitido la evolución de los sistemas complejos adaptativos.

Parte II
El universo cuántico

Capítulo 10
Simplicidad y aleatoriedad en el universo cuántico

¿Cuál es el estado actual de las leyes fundamentales de la materia y el universo? ¿Cuánto de ellas está bien establecido y cuánto es mera conjetura? ¿Y qué aspecto presentan estas leyes desde la perspectiva de la simplicidad y la complejidad, o de la regularidad y el azar?

Las leyes fundamentales están sujetas a los principios de la mecánica cuántica, y en cada etapa de nuestro razonamiento los tendremos como referencia. La mecánica cuántica es uno de los mayores descubrimientos llevados a cabo por el hombre, pero es también uno de los más difíciles de aprehender por la mente humana, incluso para los que hemos trabajado con ella a diario durante décadas. Viola nuestra intuición —o, más bien, la intuición que hemos desarrollado ignorando los fenómenos mecanocuánticos—. Esta circunstancia hace que sea de lo más necesario explorar el significado de la mecánica cuántica, especialmente en relación a las nuevas ideas sobre su interpretación. De esta manera, puede resultar más fácil comprender por qué nuestra intuición parece obviar algo tan importante.

El universo consta de materia, y la materia está compuesta por partículas elementales de muchas clases, como los electrones y los fotones. Estas partículas carecen de individualidad —cada electrón del universo es idéntico a cualquier otro, y todos los fotones son intercambiables—. Sin embargo, cada partícula puede ocupar uno entre un número infinito de diferentes «estados cuánticos». Hay dos grandes grupos de partículas: los fermiones, como los electrones, que obedecen el principio de exclusión de Pauli —dos partículas de la misma clase no pueden ocupar el mismo estado simultáneamente— y los bosones, como los fotones, que obedecen una especie de principio de antiexclusión —dos o más partículas de la misma clase muestran una tendencia a ocupar el mismo estado al mismo tiempo—. (Esta propiedad de los fotones hace posible el funcionamiento del láser, en donde fotones en un cierto estado estimulan la emisión de más fotones en ese mismo estado. Dado que los nuevos fotones se hallan en el mismo estado, viajan en la misma dirección y poseen la misma frecuencia, constituyendo el haz del láser. La palabra LÁSER es un acrónimo de Ligth Amplification by Stimulated Emission of Radiation [amplificación de luz por medio de emisión de radiación estimulada].)

Los bosones, dada su tendencia a agruparse en el mismo estado cuántico, pueden incrementar su densidad hasta tener un comportamiento prácticamente clásico, como el de los campos electromagnético y gravitatorio. Las partículas bosónicas se pueden considerar en este caso como los cuantos —paquetes cuantizados de energía— de estos campos. El cuanto del campo electromagnético es el fotón. La teoría requiere también la existencia de un cuanto para el campo gravitatorio, un bosón llamado gravitón. De hecho, todas las fuerzas fundamentales deben estar asociadas a una partícula elemental, el cuanto del campo correspondiente. A veces se dice que el cuanto «transporta» la fuerza correspondiente.

Cuando se dice que la materia está compuesta de partículas elementales —es decir, fermiones y bosones— debería hacerse notar que, bajo ciertas condiciones, algunos de estos bosones pueden comportarse como campos más que como partículas (por ejemplo, el campo eléctrico que rodea una carga). Los fermiones pueden describirse también en términos de campos que, aunque no se comportan en absoluto de manera clásica, pueden sin embargo asociarse, en cierto sentido, con fuerzas.

Toda la materia posee energía, y toda energía está asociada con materia. Cuando se habla a la ligera de la conversión de materia en energía (o viceversa), se está diciendo simplemente que ciertas clases de materia se están convirtiendo en otras. Por ejemplo, un electrón y su antipartícula asociada de carga opuesta, el positrón, pueden interaccionar y convertirse en dos fotones, un proceso que a menudo se describe como «aniquilación» o incluso «aniquilación de materia para producir energía». Sin embargo, no es más que una simple transformación de materia o, si se prefiere, de energía.

El modelo estándar

Todas las partículas elementales conocidas (excepto el gravitón, partícula exigida por consideraciones teóricas) están descritas provisionalmente por una teoría que se ha dado en llamar el modelo estándar. La trataremos con algún detalle más adelante. Esta teoría parece estar en excelente acuerdo con la observación, pese a que algunos de sus rasgos aún no han sido confirmados experimentalmente. Los físicos esperaban comprobar estas peculiaridades (junto a nuevas e interesantes ideas que van más allá del modelo estándar) en el nuevo acelerador de partículas de altas energías (el «supercolisionador superconductor» o SSC) a medio terminar en Texas. Pero sus aspiraciones se han visto frustradas por la Cámara de Representantes estadounidense, en lo que constituye un conspicuo revés para la civilización humana. La única esperanza reside ahora en el acelerador suizo, de más baja energía, que se está construyendo en el CERN, cerca de Ginebra, reconvirtiendo una máquina antigua. Desafortunadamente, las energías en las que operará puede que sean demasiado bajas.

Los que hemos participado en la elaboración del modelo estándar nos sentimos, naturalmente, muy orgullosos de él, porque ha extraído una buena dosis de simplicidad de una desconcertante variedad de fenómenos. No obstante, hay diversas razones por las que no puede ser la teoría definitiva de las partículas elementales.

En primer lugar, las fuerzas tienen formas muy similares que claman por una unificación dentro de una teoría en la que aparecerían como diferentes manifestaciones de una misma fuerza subyacente; sin embargo, en el modelo estándar estas fuerzas se tratan como diferentes y no unificadas (en contra de lo que se ha dicho algunas veces). En segundo lugar, el modelo no es lo suficientemente simple; distingue más de sesenta clases de partículas elementales, con cierto número de interacciones entre ellas, pero no aporta ninguna explicación sobre tamaña variedad. En tercer lugar, contiene más de una docena de constantes arbitrarias que describen dichas interacciones (incluyendo las constantes que representan las masas de las diferentes partículas); es difícil aceptar como fundamental una teoría en la que tantos números importantes tienen un valor no calculable en principio. Finalmente, la gravitación no está incluida en el modelo, y todos los intentos realizados para incorporarla de una manera directa topan con dificultades desastrosas: los cálculos de las magnitudes físicas relevantes incluyen correcciones infinitas, lo que conduce a resultados que carecen de sentido.

Las llamadas teorías de gran unificación

Los teóricos de las partículas elementales intentan corregir estos defectos de dos maneras. La aproximación más directa consiste en generalizar el modelo estándar en lo que algunos han llamado una «teoría de gran unificación», aunque este nombre no esté muy justificado. Veamos cómo procede esta generalización con los cuatro problemas anteriormente expuestos.

Primero, las interacciones del modelo estándar que requieren unificación se consideran de hecho unificadas, junto con otras nuevas, a energías muy altas, con una descripción natural de cómo aparecen separadas en los experimentos actuales de bajas energías. Segundo, en la teoría todas las partículas elementales están agrupadas en unos pocos conjuntos cuyos miembros están íntimamente relacionados; se logra así una gran simplificación, pese a que el número de partículas aumenta sustancialmente (algunas con masas tan elevadas que no podrán ser observadas en un futuro próximo). Tercero, la teoría contiene aún más constantes arbitrarias no calculables que el modelo estándar. Y, finalmente, la gravedad sigue sin estar incluida, y el incorporarla resulta tan difícil como antes.

Una teoría como ésta posiblemente sea válida en un amplio rango de energías. Sin embargo, los puntos tercero y cuarto la invalidan claramente como candidata a teoría fundamental de las partículas elementales.

El sueño de Einstein

La búsqueda de esta teoría unificada fundamental nos conduce a la segunda manera de trascender el modelo estándar. Nos recuerda el sueño de Einstein sobre una teoría de campos que unificara de modo natural su teoría de la relatividad general para la gravitación y la teoría de Maxwell del electromagnetismo. En su vejez, Einstein publicó un conjunto de ecuaciones que pretendía satisfacer ese propósito, pero, desafortunadamente, sus argumentos eran puramente matemáticos —no describía interacciones físicas plausibles entre la gravedad y el electromagnetismo—. El físico más grande de la era moderna había perdido sus poderes. En 1979, en Jerusalén, durante la celebración del centenario del nacimiento de Einstein, me lamenté de que una medalla conmemorativa del acontecimiento hubiese sido acuñada con aquellas ecuaciones erróneas en el reverso —qué vergüenza para un científico que en su juventud produjo tantas ecuaciones llenas de belleza, correctas y de importancia capital—. Me molesta también que muchos retratos y estatuas de Einstein (como la de la Academia Nacional de Ciencias de Washington) lo muestren en su vejez, cuando ya no hacía contribuciones importantes a la ciencia, y no cuando era aquel joven atractivo y elegante que hizo tantos descubrimientos decisivos.

La tentativa de Einstein de elaborar una teoría de campos unificada estaba condenada desde un principio, y no sólo por el declive general de sus capacidades, sino por defectos específicos en su aproximación. Entre otras cosas, ignoraba tres importantes características del problema:

Pese a todos sus defectos, los físicos teóricos modernos nos hemos inspirado en una versión actualizada del sueño de Einstein: una teoría cuántica de campos unificada que incluya el fotón, el gravitón y el resto de bosones fundamentales, con sus campos asociados electromagnético, gravitatorio, etc., así como los fermiones, tales como el electrón. Esta teoría estaría contenida en una fórmula simple que describiría la gran multiplicidad de partículas elementales y sus interacciones y que conduciría, con las aproximaciones apropiadas, a la ecuación de Einstein para la relatividad general y a las ecuaciones de Maxwell para el electromagnetismo.

La teoría de supercuerdas: El sueño tal vez realizado

En la actualidad, el sueño de Einstein quizá se haya cumplido. Una nueva clase de teoría, denominada de «supercuerdas», parece poseer las propiedades adecuadas para conseguir la unificación. En particular, la «teoría de supercuerdas heteróticas» es el primer candidato viable para convertirse en la teoría cuántica de campos unificada de todas las partículas y sus interacciones.

La teoría de supercuerdas se desarrolló a partir de un principio de autoconsistencia —lo que los físicos anglosajones llaman bootstrapprinciple (principio de la lengüeta), denominación que evoca la vieja imagen de alguien que se levanta a sí mismo del suelo tirando de las lengüetas de sus zapatos—. La idea era que un conjunto de partículas elementales podía tratarse de modo autoconsistente como si sus elementos consistiesen en combinaciones de las propias partículas. Todas ellas harían las veces de constituyentes y a la vez (incluidos, en cierto sentido, los fermiones) serían los cuantos asociados a campos de fuerza que las mantendrían unidas; todas las partículas aparecerían como estados ligados de dichos constituyentes.

Hace años intenté describir este concepto ante una audiencia de la Hughes Aircraft Company. El ingeniero encargado del programa de satélites sincrónicos, Harol Rosen, me preguntó si aquello tenía alguna relación con lo que habían descubierto él y su equipo cuando intentaban explicar la presencia de señales parásitas en los circuitos que diseñaban; finalmente habían conseguido explicarlas asumiendo que se encontraban allí y demostrando que podían generarse a sí mismas. Estuve de acuerdo en que la idea del principio de autoconsistencia era, de hecho, algo por el estilo: las partículas, si se asume que existen, podrían generar las fuerzas que las unen entre sí; los estados ligados resultantes serían las propias partículas, y serían las mismas que aquéllas que propagan las interacciones. Si existiese tal sistema de partículas, se habría dado origen a sí mismo.

La primera versión de la teoría de supercuerdas fue propuesta por John Schwartz y André Neveu en 1971, basándose en algunas ideas de Pierre Ramond. Aunque aquella teoría parecía inverosímil por aquel entonces, invité a Schwarz y Ramond a Caltech, con la impresión de que las supercuerdas eran tan hermosas que tenían que servir para algo. Schwarz y varios colaboradores suyos, entre los que destacaba Joel Scherk, desarrollaron la teoría en los quince años siguientes.

Al principio, la teoría se aplicaba únicamente a un subconjunto de partículas, el mismo que los teóricos intentaban explicar por medio del principio de autoconsistencia. Finalmente, en 1974, Scherk y Schwarz sugirieron que la teoría de supercuerdas podría describir todas las partículas elementales. Les convenció de ello el descubrimiento de que la teoría predecía la existencia del gravitón y, por lo tanto, de la gravedad einsteniana. Casi diez años más tarde, cuatro físicos, conocidos colectivamente como el «cuarteto de cuerda de Princeton», anunciaron la versión conocida como teoría de supercuerdas heteróticas.

La teoría de supercuerdas, y en particular su versión heterótica, podría ser la largamente buscada teoría cuántica de campos unificada. En una aproximación adecuada implica, como debería ser, la teoría de la gravedad de Einstein. Más aún, incorpora la relatividad general y los demás campos dentro de una teoría cuántica de campos sin caer en los habituales problemas con los infinitos. Explica también el porqué de la gran multiplicidad de partículas elementales: el número de clases diferentes es en realidad infinito, pero sólo un número finito de ellas (algunos cientos, probablemente) tienen una masa lo suficientemente pequeña como para ser detectadas en el laboratorio. La teoría no contiene, al menos en principio, constantes arbitrarias o listas de partículas o interacciones, aunque en los análisis más minuciosos pueden reaparecer algunas indeterminaciones. Por último, la teoría de supercuerdas emerge de un simple y hermoso principio de autoconsistencia.

La teoría de casi todo

De entre todas las cuestiones fundamentales sobre la teoría heterótica de supercuerdas, la que aquí más nos interesa es la siguiente: asumiendo que es correcta, ¿es realmente la teoría de todo? Algunos han empleado esta expresión, incluso la abreviatura TDT, para describirla. Sin embargo, se trata de una caracterización engañosa, a menos que «todo» quiera decir únicamente la descripción de las partículas elementales y sus interacciones. La teoría no puede explicar por sí misma todo lo que es cognoscible sobre el universo y la materia que éste contiene. Se necesitan también otras clases de información.

Las condiciones iniciales y la(s) flecha(s) del tiempo

Parte de esta información adicional se refiere a las condiciones iniciales del universo al principio de su expansión, o cerca. Sabemos que el universo ha estado expandiéndose durante los últimos diez mil millones de años. Esa expansión se revela con claridad a los astrónomos cuando observan cúmulos distantes de galaxias con potentes telescopios, pero no es en absoluto evidente cuando se observan objetos más cercanos. El sistema solar no se está expandiendo, ni nuestra galaxia, ni siquiera el cúmulo de galaxias al que pertenece la Vía Láctea. Las otras galaxias y cúmulos tampoco están expandiéndose. Pero los diferentes cúmulos se alejan unos de otros, y es esta recesión la que revela la expansión del universo. Nos podemos hacer una idea de esta expansión pensando en la cocción de un pastel de pasas: debido a la levadura, la masa del pastel (el universo) se expande, pero las pasas (los cúmulos de galaxias) no, aunque se separan entre sí.

El comportamiento del universo desde el comienzo de su expansión depende, obviamente, de las leyes que rigen el comportamiento de las partículas que lo componen y también de sus condiciones iniciales. Pero estas condiciones iniciales no son algo que sólo se presente en abstrusos problemas de física y astronomía, ni mucho menos. Desempeñan un papel importantísimo en nuestra experiencia cotidiana. En particular, determinan la flecha (o flechas) del tiempo.

Imaginemos la filmación de un meteorito que penetra en la atmósfera terrestre brillando incandescente mientras cruza el firmamento, y que se estrella finalmente contra la Tierra con un tamaño y peso mucho menor que al principio de su vuelo, consumida la mayor parte de su sustancia debido al calor generado por la fricción. Si proyectásemos la película al revés, veríamos una roca parcialmente enterrada en el suelo alzarse en el aire por iniciativa propia, aumentar de tamaño al recoger materia del aire mientras traza un arco en el cielo y alejarse finalmente por el espacio, más grande y más fría. La inversión temporal de la película es una secuencia de sucesos claramente imposible en el mundo real: podemos identificarla inmediatamente como una película proyectada al revés.

Esta asimetría en el comportamiento del universo al avanzar el tiempo hacia adelante o hacia atrás se conoce como la flecha del tiempo. En ocasiones se consideran separadamente diversos aspectos de esta asimetría como diferentes flechas del tiempo. Sin embargo, todas ellas están relacionadas; todas comparten el mismo origen último. Pero ¿cuál es este origen?

¿Puede basarse la explicación de la flecha o flechas del tiempo en las leyes fundamentales de las partículas elementales? Si un cambio en el signo del tiempo en las ecuaciones que describen estas leyes las deja invariables, entonces diremos que son simétricas respecto del sentido del tiempo. Si una inversión del tiempo altera la forma de las ecuaciones, diremos que presentan una asimetría temporal o que violan la simetría temporal. Una violación de este tipo podría dar cuenta, en principio, de la flecha del tiempo y, de hecho, se ha observado la existencia de una pequeña violación de esta simetría, aunque es un efecto demasiado particular para ser el causante de un fenómeno tan general como la flecha del tiempo.

La explicación alternativa es la siguiente: si desde el presente observamos en ambos sentidos del tiempo, encontramos que en uno de ellos, a una distancia de unos diez mil millones de años, el universo presenta un estado muy peculiar. Este sentido recibe un nombre arbitrario: el pasado. El sentido opuesto es el futuro. En el estado correspondiente a las condiciones iniciales, el universo era pequeño, pero esa pequeñez no caracteriza completamente su estado, que también era especialmente simple. Si en un futuro muy distante el universo deja de expandirse y comienza a contraerse, empequeñeciéndose de nuevo, no hay ninguna razón para creer que el estado final resultante sea el mismo que el estado inicial. La asimetría entre pasado y futuro se habrá mantenido.

Un candidato para las condiciones iniciales

Dado que ha surgido un candidato viable para convertirse en la ley unificada de las partículas elementales, resulta razonable preguntarse si disponemos también de una teoría plausible para las condiciones iniciales del universo. Efectivamente, existe una, propuesta por Jim Hartle y Steve Hawking a principios de los ochenta. A Hawking le gusta llamarla «condiciones de contorno sin contorno», un nombre válido pero que no transmite lo que tiene de particularmente interesante en lo que respecta a la información. Si las partículas elementales pueden realmente describirse por una teoría unificada (lo que Hartle y Hawking no asumen explícitamente), entonces se podría calcular, a partir de esa teoría, una versión modificada de sus condiciones iniciales, y las dos leyes fundamentales de la física, una para las partículas elementales y otra para el universo, se convertirían en una sola.

En vez de todo, sólo probabilidades para historias

Sea o no correcta la idea de Hartle y Hawking, todavía podemos preguntamos lo siguiente: si especificamos la teoría unificada de las partículas elementales y las condiciones iniciales del universo, ¿podemos predecir el comportamiento del universo y de todo lo que contiene? La respuesta es que no, porque las leyes de la física son cuánticas, y la mecánica cuántica no es determinista. Sólo permite predecir probabilidades. Las leyes fundamentales de la física nos capacitan, en principio, para calcular las probabilidades de diferentes historias alternativas del universo que, dadas las condiciones iniciales, describan diferentes sucesiones de acontecimientos. La información sobre cuál de estas historias es la que está ocurriendo realmente sólo puede obtenerse a partir de la observación, y es suplementaria a las propias leyes fundamentales. De modo que es imposible que las leyes fundamentales nos suministren una teoría de todo.

La naturaleza probabilística de la teoría cuántica puede ilustrarse con un ejemplo simple: cualquier núcleo atómico radiactivo tiene una propiedad llamada «vida media», que es el período de tiempo en el que la probabilidad de desintegrarse es de un 50 por ciento. Por ejemplo, la vida media del Pu239 —el isótopo típico del plutonio— es de unos 25 000 años. Después de 25 000 años, hay una probabilidad del 50 por ciento de que un núcleo determinado de Pu239 no se haya desintegrado; tras 50 000 años, la probabilidad es sólo del 25 por ciento; tras 75 000 años, del 12,5 por ciento, etc. El carácter mecanocuántico de la naturaleza implica que esto es todo lo que podemos decir de un núcleo de Pu239 acerca de su desintegración; no hay forma de predecir el momento exacto en que se producirá. Unicamente es posible determinar una probabilidad en función del tiempo transcurrido, como indica la Figura 10. (Esta curva se conoce como decrecimiento exponencial; la función opuesta, el crecimiento exponencial, también se representa. Cualquier función exponencial genera, a intervalos iguales de tiempo, una progresión geométrica, tal como 1/2, 1/4, 1/8, 1/16, ... para el decrecimiento, o 2, 4, 8, 16, ... para el crecimiento.)

010.jpg
Figura 10. Arriba: Decrecimiento exponencial de la facción de núcleos radiactivos no desintegrados al cabo de un tiempo t. Abajo: Crecimiento exponencial

Si el momento de la desintegración radiactiva no se puede predecir con exactitud, la dirección en que se produce es absolutamente impredictible. Supongamos que el núcleo de Pu239 está en reposo y que se desintegrará en dos fragmentos cargados eléctricamente, uno mucho mayor que el otro, que se moverán en sentidos opuestos. Todas las direcciones resultan entonces igualmente probables para el movimiento de uno de los fragmentos, pongamos el más pequeño. No hay forma de predecir en qué dirección se moverá.

Si hay tal grado de desconocimiento a priori sobre un núcleo atómico, imaginemos cuánto más fundamental es la impredictibilidad del universo entero, incluso aunque dispongamos de una teoría unificada de las partículas elementales y de sus condiciones iniciales.

Más allá de esos principios presumiblemente simples, cada historia alternativa del universo depende del resultado de un número inconcebiblemente grande de accidentes.

Regularidades y complejidad efectiva a partir de accidentes congelados

Tales accidentes tienen resultados aleatorios, como requiere la mecánica cuántica, los cuales han contribuido a determinar el carácter de las galaxias individuales (como nuestra Vía Láctea), de cada estrella y planeta (como el Sol y la Tierra), de la vida en la Tierra y de las especies particulares que evolucionaron en nuestro planeta, de los organismos individuales como nosotros mismos y de los sucesos de la historia humana y de nuestras propias vidas. El genoma de cualquier ser humano ha recibido la influencia de un sinnúmero de accidentes cuánticos, no sólo en las mutaciones del plasma germinal ancestral, sino también en la fecundación de un óvulo particular por un espermatozoide determinado.

El contenido de información algorítmica de cada posible historia alternativa del universo incluye evidentemente una pequeña contribución de las leyes fundamentales simples, junto con una gigantesca contribución de todos los accidentes cuánticos que surgen por el camino. Pero no sólo el contenido de información algorítmica del universo está dominado por tales accidentes; aunque son sucesos aleatorios, sus efectos contribuyen en gran medida a la complejidad efectiva.

La complejidad efectiva del universo es la longitud de una descripción concisa de sus regularidades. Como el contenido de información algorítmica, la complejidad efectiva sólo recibe una pequeña contribución de las leyes fundamentales. El resto proviene de las numerosas regularidades que resultan de los «accidentes congelados». Éstos son sucesos aleatorios cuyos resultados particulares tienen múltiples consecuencias a largo plazo, todas relacionadas por sus antecedentes comunes.

Las consecuencias de muchos de estos accidentes pueden resultar trascendentales. El carácter de la totalidad del universo se vio afectado por accidentes que ocurrieron cerca del comienzo de su expansión. La naturaleza de la vida sobre la Tierra depende de sucesos aleatorios que ocurrieron hace unos cuatro mil millones de años. Una vez que el resultado de uno de estos sucesos queda determinado, sus consecuencias a largo plazo pueden tomar el carácter de una ley perteneciente a cualquier nivel, excepto el más fundamental. Una ley geológica, biológica o psicológica puede nacer de uno o más sucesos cuánticos amplificados, cada uno de los cuales podría haber tenido un resultado diferente. Las amplificaciones pueden darse en virtud de multitud de mecanismos, entre ellos el fenómeno del caos, que en ciertas situaciones introduce una sensibilidad indefinidamente grande a las condiciones iniciales.

Para comprender por completo la significación de estos sucesos aleatorios, es necesario estudiar con mayor profundidad el sentido de la mecánica cuántica, la cual nos enseña que el azar juega un papel fundamental en la descripción de la naturaleza.

Capítulo 11
Una visión contemporánea de la mecánica cuántica: La mecánica cuántica y la aproximación clásica

Cuando se descubrió la mecánica cuántica, el hecho más sorprendente fue el contraste entre su carácter probabilístico y las certidumbres de la antigua física clásica, en la cual un conocimiento exacto y completo de las condiciones iniciales permitiría en principio, por medio de la teoría correcta, especificar completa y exactamente la realización de cualquier suceso. No se puede aplicar a la mecánica cuántica un determinismo perfecto de este tipo, pero a menudo se aplica de modo aproximado bajo las condiciones en las que la física clásica es casi correcta —lo que podemos llamar el dominio cuasiclásico—. Este dominio puede caracterizarse, a grandes rasgos, como el de los objetos masivos. Por ejemplo, el movimiento de los planetas en torno al Sol puede calcularse para cualquier propósito práctico sin considerar correcciones cuánticas, por completo despreciables en un problema de este tipo. Si el dominio cuasiclásico no fuese tan importante, los físicos no hubieran desarrollado y empleado la física clásica en primer lugar, y las teorías clásicas, como las de Maxwell y Einstein, no habrían conseguido sus maravillosos éxitos en la predicción de los resultados de las observaciones. Éste es otro caso en el que no se descarta el antiguo paradigma (como lo llamaría Kuhn) cuando se adopta uno nuevo, sino que permanece como una aproximación válida en un marco apropiado (como la teoría de la gravitación de Newton, que continúa siendo inmensamente útil como aproximación de la teoría de Einstein cuando las velocidades implicadas son relativamente pequeñas comparadas con la de la luz). Sin embargo, la física clásica es sólo una aproximación, mientras que la mecánica cuántica es, hasta donde sabemos, absolutamente correcta. Aunque han transcurrido muchas décadas desde su descubrimiento en 1924, sólo ahora los físicos se están aproximando a una interpretación realmente satisfactoria de la mecánica cuántica, interpretación que permite una comprensión más profunda de cómo surge el dominio cuasiclásico de nuestra experiencia cotidiana a partir del carácter mecanocuántico subyacente de la naturaleza.

La mecánica cuántica aproximada de los sistemas objeto de medida

Cuando fue formulada originalmente por sus descubridores, la mecánica cuántica era presentada a menudo de una manera curiosamente restrictiva y antropocéntrica. Más o menos, se asume que cierto experimento (como la desintegración radiactiva de núcleos atómicos de una clase particular) se repite de forma idéntica una y otra vez. Se observa cada vez el resultado del experimento, preferiblemente por parte de un físico que emplea algún tipo de instrumento. Se supone que es importante que el físico y su aparato sean externos al sistema objeto de estudio. El físico registra los porcentajes con que ocurren los diferentes resultados posibles del experimento (tales como los tiempos de desintegración). Cuando el número de repeticiones tiende a infinito, estos porcentajes tienden a aproximarse a las probabilidades de los diferentes resultados, probabilidades predichas por la mecánica cuántica. (La probabilidad de la desintegración radiactiva en función del tiempo está estrechamente relacionada con la fracción de núcleos que permanecen sin desintegrarse después de transcurrido un cierto tiempo, como se muestra en la Figura 10. La probabilidad de desintegración sigue una curva similar.)

Esta interpretación original de la mecánica cuántica, restringida a la repetición de experimentos realizados por observadores externos, es demasiado estrecha para resultar aceptable hoy día como caracterización fundamental, especialmente desde que se ha ido aclarando que la mecánica cuántica debe aplicarse al universo como un todo. La interpretación original no es incorrecta, pero sólo puede aplicarse a las situaciones para las cuales fue desarrollada. Más aún, en un contexto más amplio esta interpretación debe considerarse aproximada además de particular. Podemos referimos a ella como «mecánica cuántica aproximada de sistemas objeto de medida».

La interpretación moderna

Para describir el universo, se hace necesaria una interpretación más general de la mecánica cuántica, dado que en este caso no existen experimentadores ni instrumentos externos, ni la posibilidad de realizar repeticiones para observar muchas copias (en cualquier caso, al universo le trae sin cuidado que unos seres humanos surgidos en un oscuro planeta estudien su historia, y seguirá obedeciendo las leyes mecanocuánticas de la física independientemente de la observación a que se le someta). Este hecho es una de las razones del desarrollo en las últimas décadas de lo que yo llamo la interpretación moderna de la mecánica cuántica. La otra razón principal es la necesidad de una comprensión más clara de la relación entre la mecánica cuántica y la descripción clásica aproximada del mundo que nos rodea.

En las primeras discusiones sobre la mecánica cuántica, a menudo se consideraba implícitamente, si no de modo explícito, la existencia de un dominio clásico apartado de la mecánica cuántica, de modo que la teoría física básica de algún modo requería leyes clásicas además de las mecanocuánticas. Esta situación podía parecer satisfactoria para una generación educada en la física clásica, pero a muchos hoy nos parece estrafalaria además de innecesaria. La interpretación moderna de la mecánica cuántica propone que el dominio cuasiclásico surge de las leyes de la mecánica cuántica, incluyendo las condiciones iniciales al comienzo de la expansión del universo. El mayor desafío reside en comprender la manera en que surge este dominio.

El pionero de la interpretación moderna fue Hugh Everett III, un estudiante graduado que trabajaba con John A. Wheeler en Princeton, posteriormente miembro del Grupo de Evaluación de Sistemas Armamentísticos del Pentágono. Varios físicos teóricos han trabajado en ella desde entonces, incluyendo a James Hartle y a mí mismo. Hartle (perteneciente a la Universidad de California en Santa Bárbara y al Instituto de Santa Fe) es un eminente cosmólogo teórico, experto en la teoría de la relatividad general de Einstein. A principios de los sesenta, dirigí su tesis sobre la teoría de las partículas elementales en Caltech. Más tarde, Stephen Hawking y él escribieron un artículo fundamental titulado «La función de onda del universo», que desempeñó un papel primordial en la conformación del nuevo campo de la cosmología cuántica. Desde 1986, Jim y yo hemos trabajado juntos intentando clarificar cómo debe concebirse la mecánica cuántica, especialmente en relación con el dominio cuasiclásico.

Nosotros consideramos útiles e importantes las contribuciones de Everett, pero creemos que todavía queda mucho que hacer en esa dirección. En algunos casos, la elección del vocabulario, tanto suya como de sus divulgadores, ha provocado cierta confusión. Su interpretación se describe a menudo en términos de «múltiples mundos», lo que nosotros reinterpretamos como «múltiples historias alternativas del universo». Además, los «múltiples mundos» se describen como «igualmente reales», mientras que nosotros pensamos que es menos confuso hablar de «múltiples historias, tratadas de modo equitativo por la teoría excepto en lo que se refiere a sus probabilidades respectivas». El lenguaje que proponemos conduce a la noción familiar de que un sistema puede tener diferentes historias posibles, cada una con su propia probabilidad; no es necesario indigestarse intentando concebir muchos «universos paralelos», todos ellos igualmente reales. (Un distinguido físico, versado en mecánica cuántica, dedujo de ciertos comentarios sobre la interpretación de Everett que cualquiera que la aceptase querría jugar apostando dinero a la ruleta rusa, porque en alguno de los mundos «igualmente reales» el jugador sobreviviría y se haría rico.)

Otro problema lingüístico proviene de que Everett evitó la palabra «probabilidad» en la mayoría de contextos, utilizando en su lugar la noción matemáticamente equivalente, pero menos familiar, de «medida». Hartle y yo no encontramos ninguna ventaja en esto. Dejando de lado las palabras, Everett dejó algunos problemas importantes sin resolver, y el principal desafío no es una cuestión de lenguaje, sino rellenar los vacíos existentes en nuestra comprensión de la mecánica cuántica.

Jim Hartle y yo formamos parte de un grupo internacional de físicos teóricos que intenta de diversas maneras elaborar una interpretación moderna de la mecánica cuántica. Entre los que han realizado aportaciones especialmente valiosas figuran Robert Griffiths y Roland Omnés, con quienes compartimos la fe en la importancia de las historias, así como Erich Joos, Dieter Zeh y Wojciech («Wojtek») Zurek, que tienen puntos de vista algo diferentes. La formulación de la mecánica cuántica en términos de historias se debe a Dick Feynman, quien la elaboró a partir del trabajo preliminar de Paul Dirac. Esta formulación no sólo permite clarificar la interpretación moderna; es también particularmente útil para describir la mecánica cuántica en interacción con la gravitación einsteniana, como ocurre en la cosmología cuántica. La geometría del espacio-tiempo se encuentra entonces sujeta a la indeterminación mecanocuántica, y el método basado en las historias permite manejar particularmente bien esta situación.

El estado cuántico del universo

La noción de estado cuántico es un ingrediente fundamental de cualquier tratamiento de la mecánica cuántica. Consideremos una imagen algo simplificada del universo, en la cual cada partícula no tiene más atributos que la posición y el momento, y no se tiene en cuenta la indistinguibilidad de las partículas de una clase dada (por ejemplo, el hecho de que todos los electrones sean intercambiables). ¿Qué significa en este caso un estado cuántico de todo el universo? Para comenzar, es preferible considerar el estado cuántico de una única partícula, y después de dos, antes de abarcar el universo entero.

En la física clásica sería legítimo especificar exactamente y al mismo tiempo la posición y el momento de una partícula dada, pero en mecánica cuántica, como es bien sabido, esto está prohibido por el principio de incertidumbre, o de indeterminación. Se puede especificar exactamente la posición de una partícula, pero entonces su momento estará por completo indeterminado; esta situación caracteriza un tipo particular de estado cuántico para una sola partícula, un estado definido por su posición. En otro tipo de estado cuántico es el momento el que se especifica y la posición está por completo indeterminada. Existe una variedad infinita de posibles estados cuánticos para una única partícula, en los cuales no están determinados exactamente ni el momento ni la posición, sino sólo una distribución de probabilidad para cada uno. Por ejemplo, en un átomo de hidrógeno, formado por un único electrón (cargado negativamente) dentro del campo eléctrico de un único protón (cargado positivamente), el electrón puede hallarse en el estado de mínima energía, en el que la posición está difuminada en una región del tamaño del átomo y su momento se halla igualmente distribuido.

Consideremos ahora un «universo» formado por dos electrones. Técnicamente es posible que su estado cuántico sea tal que cada electrón por separado esté en un estado cuántico definido. Sin embargo, esto no suele pasar en la realidad, dado que los dos electrones interactúan, especialmente a través de la repulsión eléctrica mutua. El átomo de helio, por ejemplo, consta de dos electrones situados dentro del campo eléctrico generado por un núcleo central con dos cargas positivas. En el estado de mínima energía del átomo de helio, no es cierto que cada electrón por separado se encuentre en un estado cuántico definido, aunque a veces, como aproximación, se considere que es así. Lo que ocurre es que, como resultado de la interacción entre los electrones, su estado cuántico conjunto es tal que los estados de ambos electrones se confunden (están correlacionados). Si se está interesado en el comportamiento de uno de los electrones, se debe integrar («sumar») sobre todas las posiciones (o los momentos, o los valores de cualquier otro atributo) del segundo electrón, y entonces el electrón considerado no se hallará en un estado cuántico definido («puro»), sino que podrá encontrarse en varios estados puros de un solo electrón, cada uno con una cierta probabilidad. Se dice que el electrón se encuentra en un «estado cuántico mezcla».

Ahora podemos pasar directamente a considerar el universo entero. Si se encuentra en un estado cuántico puro, éste es tal que los estados de las partículas individuales que contiene están correlacionados entre sí. Si integramos todas las situaciones en ciertas partes del universo, entonces el resto (lo que «se sigue», la parte no integrada) está en un estado cuántico mezcla.

El universo como un todo podría estar en un estado cuántico puro. Con esta suposición, Hartle y Hawking han propuesto una forma particular para el estado puro que existía cerca del comienzo de la expansión del universo. Como ya se dijo antes, su hipótesis especifica este estado cuántico inicial en función de la teoría unificada de las partículas elementales. Esta misma teoría unificada determina la evolución temporal de dicho estado cuántico. No obstante, la completa especificación del estado cuántico de todo el universo —no sólo inicialmente, sino en todo momento— no proporciona todavía una interpretación de la mecánica cuántica.

El estado cuántico del universo es como un libro que contiene la respuesta a una variedad infinita de preguntas. Un libro así en realidad no es útil a menos que se disponga de una lista de las cuestiones a consultar. La interpretación moderna de la mecánica cuántica se está construyendo a partir de considerar las preguntas que deben plantearse al estado cuántico del universo.

Puesto que la mecánica cuántica es probabilística y no determinista, esas cuestiones se refieren inevitablemente a probabilidades. Hartle y yo, así como Griffiths y Omnés, nos servimos del hecho de que las cuestiones se refieren siempre, en última instancia, a las historias alternativas del universo. (Con el término «historia» no pretendemos dar preponderancia al pasado a expensas del futuro, ni hacemos referencia a los registros escritos de la historia del hombre; una historia es, simplemente, la narración de una secuencia temporal de sucesos pasados, presentes o futuros.) Las cuestiones sobre las historias alternativas pueden ser del tipo, «¿cuál es la probabilidad de que ocurra esta historia particular del universo, en lugar de aquellas otras?», o «dadas estas afirmaciones sobre la historia del universo, ¿cuál es la probabilidad de que estas otras sean también ciertas?». A menudo, este último tipo de cuestiones adopta la forma familiar, «dadas estas afirmaciones sobre el pasado o el presente, ¿cuál es la probabilidad de que se hagan realidad estas otras afirmaciones sobre el futuro?».

Historias alternativas en el hipódromo

Un lugar apropiado para encontrar probabilidades es el hipódromo, donde aparecen en relación con las apuestas. Si las apuestas en contra de que un caballo gane una carrera están 3 a 1, la probabilidad de que gane es 1/4; si las apuestas están 2 a 1, la probabilidad es 1/3, etc. (Por supuesto, las apuestas reales que se cotizan en un hipódromo no corresponden a probabilidades verdaderas; más tarde volveremos sobre este punto.) Si en una carrera participan diez caballos, cada uno de ellos tiene una probabilidad positiva de ganar (¡o una probabilidad cero, en un caso realmente desesperado!), y estas diez probabilidades suman 1, si es que ha de haber exactamente un ganador entre ellos. Los diez resultados posibles son mutuamente excluyentes (sólo uno puede ocurrir) y exhaustivos (uno de ellos debe ocurrir). Una propiedad natural de estas diez probabilidades es que son aditivas', la probabilidad de que gane el tercer o el cuarto caballo será la suma de las probabilidades individuales de que gane el tercer caballo y de que gane el cuarto.

Se puede trazar un paralelismo más cercano entre la experiencia del hipódromo y las historias del universo considerando una secuencia de carreras, ocho por ejemplo, en cada una de las cuales corren diez caballos. Supongamos para simplificar que sólo tenemos en cuenta a los ganadores (no la clasificación de otros caballos) y que sólo hay un ganador por carrera (no pueden darse empates). Cada lista de ocho ganadores representa una historia, y estas historias son mutuamente excluyentes y exhaustivas, como en el caso de una única carrera. El número de historias alternativas es igual al producto de ocho factores de diez, uno por carrera, es decir, cien millones.

Las probabilidades de las diferentes secuencias de victorias tienen la misma propiedad aditiva que las probabilidades de ganar de los caballos individuales, la probabilidad de que se dé una u otra secuencia particular de ganadores es igual a la suma de las probabilidades de ambas secuencias. Podríamos llamar «historia combinada» a una situación en la que se produjese una u otra de las secuencias.

Etiquetemos cada una de las historias alternativas individuales como A y B, respectivamente. La propiedad aditiva determina que la probabilidad de la historia combinada «A o B» es la probabilidad de A más la probabilidad de B. En otras palabras, la probabilidad de que mañana vaya a París o me quede en casa es la suma de la probabilidad de que mañana vaya a París más la probabilidad de que me quede en casa. Una magnitud que no obedezca esta regla no es una probabilidad.

Historias alternativas en mecánica cuántica

Imaginemos que especificamos un conjunto de historias alternativas del universo, mutuamente excluyentes y exhaustivas. ¿Les asigna siempre la mecánica cuántica una probabilidad a cada una? Sorprendentemente, no siempre. En su lugar, asigna a cada par de tales historias una magnitud llamada D, y proporciona una regla para calcular D en función del estado cuántico del universo. Las dos historias de un par dado pueden ser distintas, como las alternativas A y B, o la misma, como A y A. El valor de D se indica por la expresión D(A, B). que se lee D de A y B. Si las dos historias del par son la misma, tendremos D(A, A). Si ambas son la historia combinada A o B, designaremos el valor de D por D(A o B, A o B).

Cuando las dos historias del par son la misma, D es un número entre cero y uno, como una probabilidad. De hecho, bajo ciertas condiciones puede interpretarse como la probabilidad de la historia. Para ver de qué condiciones se trata, examinemos la relación entre las siguientes cantidades,

D(A o B, A o B).
D(A, A).
D(B, B).
D(A, B) más D(B, A).

Las tres primeras cantidades son un número entre cero y uno, y podrían ser probabilidades. La última puede ser positiva, negativa o cero, por lo que no es una probabilidad. La regla para calcular D en mecánica cuántica establece que la primera cantidad es la suma de las otras tres. Pero si la última cantidad es siempre cero cuando A y B son diferentes, entonces D(A o B, A o B) es igual a D(A, A) más D(B, B). En otras palabras, si D vale siempre cero cuando las dos historias son diferentes, entonces el valor de D para una historia posee siempre la propiedad aditiva y puede así interpretarse como la probabilidad de dicha historia.

La cuarta cantidad de la lista se denomina término de interferencia entre las historias A y B. Si no vale cero para todo par de historias diferentes, no es posible asignar a estas historias unas probabilidades mecanocuánticas. Se dice entonces que las historias «interfieren» entre sí.

Como lo máximo que la mecánica cuántica puede hacer en cualquier situación es predecir una probabilidad, no sirve para nada en el caso de historias que interfieran entre sí. Estas historias sólo son útiles para componer historias combinadas que no interfieran.

Historias detalladas del universo

Las historias completamente detalladas del universo son aquellas que proporcionan una descripción del universo entero tan completa como sea posible en todo momento. ¿Qué puede decimos sobre ellas la mecánica cuántica?

Prosigamos con nuestra imagen simplificada del universo, en la que las partículas no tienen más atributos que su posición y momento, y en la que no consideramos la indistinguibilidad de las partículas de una clase dada. Si la física clásica determinista fuese absolutamente correcta, entonces podríamos especificar, en cualquier instante dado, la posición y el momento de todas las partículas del universo. La dinámica clásica podría, en principio, predecir con certeza las posiciones y momentos de todas las partículas en cualquier tiempo futuro. (El fenómeno del caos produce situaciones en las que la menor imprecisión en las condiciones iniciales conduce a incertidumbres arbitrariamente grandes en las predicciones futuras, pero la teoría clásica, perfectamente determinista, sería aún correcta si asumimos una información inicial perfecta.)

¿Cuál sería la situación correspondiente en la mecánica cuántica, frente a la cual la física clásica es una mera aproximación? Por una parte, carece de sentido especificar a la vez la posición y el momento exactos de una partícula al mismo tiempo; esto forma parte del célebre principio de incertidumbre. En mecánica cuántica, el estado del universo simplificado en un instante dado podría caracterizarse especificando la posición de todas las partículas (o la posición de algunas y el momento de las demás, o el momento de todas, o cualquier otra combinación posible). Un tipo de historia completamente detallada de nuestro universo simplificado consistiría en las posiciones de todas las partículas en todo momento.

Dado que la mecánica cuántica es probabilística en lugar de determinista, uno podría esperar que nos proporcionase una probabilidad para cada historia detallada. Sin embargo, no ocurre así. Los términos de interferencia entre historias detalladas no son siempre nulos, de modo que no es posible asignarles probabilidades.

En el hipódromo, sin embargo, el apostador no tiene que preocuparse por ningún término de interferencia entre una secuencia de ganadores y otra. ¿Por qué no? ¿Por qué el apostador maneja verdaderas probabilidades, que se suman correctamente, mientras que la mecánica cuántica sólo proporciona, al nivel de las historias detalladas, cantidades cuya suma se ve estorbada por los términos de interferencia? La respuesta a esta cuestión es que, para obtener probabilidades reales, es necesario considerar historias lo suficientemente poco detalladas.

Historias no detalladas

La secuencia de ocho carreras de caballos no es sólo una metáfora, sino un ejemplo real de historia muy poco detallada del universo. Dado que sólo consideramos la lista de ganadores, su ausencia de detalle, es decir, su baja resolución, reside en los siguientes puntos,

Para las historias del universo consideradas en mecánica cuántica, la baja resolución significa tener en cuenta únicamente ciertas cosas en ciertos instantes y sólo con un cierto grado de detalle. Podemos imaginamos una historia no detallada como una clase de historias detalladas alternativas, todas ellas coincidentes en lo que se sigue, pero que se diferencian en el comportamiento posible de todo lo accesorio, es decir, aquello que se integra. En nuestro ejemplo de las carreras de caballos, cada historia no detallada es la clase de todas las historias detalladas que comparten la misma secuencia de ocho ganadores en una tarde y un hipódromo particulares; cada historia detallada, por su parte, difiere de las demás en las posibles alternativas para cualquier otro rasgo de la historia del universo.

Así pues, todas las historias detalladas del universo se agrupan en clases, de manera que cada cual pertenece a una clase y sólo una. Estas clases exhaustivas y mutuamente excluyentes constituyen historias no detalladas (tales como las diferentes secuencias posibles de ganadores de ocho carreras sin empates). Supongamos que una clase dada está formada por sólo dos historias detalladas, J y K; la historia no detallada será «J o K», lo que significa que ocurre J u ocurre K. De modo análogo, si la clase comprende muchas historias detalladas, la historia no detallada será la historia combinada en la que ocurre una cualquiera de las historias detalladas.

Los matemáticos llamarían a las historias no detalladas «clases de equivalencia» de historias detalladas. Cada historia detallada pertenece a una y sólo una clase de equivalencia, y los miembros de cada clase se consideran equivalentes.

Imaginemos que las únicas cosas que hay en el universo son los caballos de las ocho carreras y algunos tábanos, y que todo lo que puede hacer cada caballo es ganar una carrera o no ganarla. Cada historia detallada de este universo absurdamente supersimplificado consiste en una secuencia de caballos ganadores y una narración de lo que han hecho los tábanos. Si las historias no detalladas consideran únicamente los caballos y sus victorias, ignorando los insectos, entonces cada una estará formada por todas las historias detalladas con una secuencia particular de caballos ganadores y un destino cualquiera para los tábanos. En general, cada historia no detallada es una clase de equivalencia de historias detalladas caracterizadas por un narración particular que describe los fenómenos que se siguen y una narración cualquiera de entre las posibles alternativas que describen todo aquello que se ignora.

Las historias no detalladas pueden eliminar los términos de interferencia

Cuando tratamos con las historias mecanocuánticas del universo, ¿cómo pueden agruparse las historias detalladas en clases de equivalencia que correspondan a historias no detalladas con verdaderas probabilidades? ¿Cómo se consigue que las historias no detalladas apropiadas no tengan términos de interferencia entre ellas? Todo ello es posible porque el término de interferencia entre dos historias no detalladas es la suma de todos los términos de interferencia entre pares de historias detalladas pertenecientes a cada una de las dos historias no detalladas. La suma de todos los términos, de signo positivo y negativo, puede producir muchas cancelaciones y dar un resultado pequeño, o incluso cero. (Recordemos que el valor de D para una historia emparejada con ella misma está siempre entre cero y uno, como una probabilidad real; cuando se suman cantidades de este tipo, no pueden cancelarse.)

El comportamiento de cualquier cosa del universo ignorada en una historia no detallada se dice que ha sido «integrado» en este proceso de sumación. Todos los detalles accesorios, todos los instantes de tiempo, lugares y objetos ajenos a nuestra consideración, se integran. Una clase de equivalencia podría, por ejemplo, agrupar todas las historias detalladas en las que ciertas partículas tienen una posición dada en cada instante de tiempo, mientras que el resto de partículas de nuestro universo simplificado puede encontrarse en cualquier lugar. Diríamos entonces que se siguen en cada momento las posiciones del primer conjunto de partículas, y que las del segundo conjunto se integran y se ignoran.

Una resolución aún más baja se podría conseguir siguiendo la posición del primer conjunto de partículas sólo en determinados instantes, de modo que se integra todo lo que sucede en cualesquiera otros momentos.

Decoherencia de las historias no detalladas: Probabilidades verdaderas

Si el término de interferencia entre cada par de historias no detalladas vale cero, de manera exacta o con una muy buena aproximación, entonces se dice que estas historias son decoherentes. El valor de D para cada historia no detallada y ella misma es entonces una probabilidad verdadera, con la propiedad aditiva. En la práctica, la mecánica cuántica se aplica siempre a conjuntos de historias no detalladas decoherentes, y por ello es capaz de predecir probabilidades. (D se denomina, dicho sea de paso, funcional decoherente; la palabra «funcional» se refiere a que depende de las historias consideradas.)

En el caso de las carreras vespertinas, la resolución empleada puede resumirse como sigue, se integra el destino de cualquier objeto del universo, excepto los ganadores de las carreras de un determinado hipódromo, así como los sucesos en cualquier instante de tiempo, excepto los momentos en que se producen las victorias en las ocho carreras de un día en particular. Las historias no detalladas resultantes son decoherentes y poseen probabilidades auténticas. Dada nuestra experiencia cotidiana, no nos sorprende que las cosas funcionen de este modo, pero debería intrigarnos el por qué es así.

Confusión y mecanismos de decoherencia

¿Cuál es el fundamento de la decoherencia, el mecanismo que hace que los términos de interferencia sumen cero permitiendo así la asignación de probabilidades? Lo que ignoramos o integramos en las historias no detalladas es la maraña de sucesos que éstas no describen. Los caballos y jinetes de las carreras están en contacto con las moléculas del aire, los granos de arena de la pista, los fotones del sol y los tábanos; todos estos elementos están integrados en las historias no detalladas de las carreras. Los diferentes resultados posibles de las carreras están correlacionados con los diferentes destinos de todo lo que se ignora en las historias no detalladas. Pero estos destinos están integrados, y la mecánica cuántica nos dice que en el proceso de sumación, bajo las condiciones apropiadas, los términos de interferencia entre historias con diferentes destinos para lo que se ignora desaparecen. Debido a la confusión entre sucesos, los términos de interferencia entre los diferentes resultados de las carreras también se anulan.

Produce vértigo considerar, en lugar de historias no detalladas decoherentes, el caso extremo de historias detalladas con términos de interferencia no nulos y sin probabilidades verdaderas. Estas historias seguirían, durante una carrera, la evolución de cada partícula elemental contenida en cada caballo y en todo lo que estuviera en contacto con él. Pero no hace falta llegar a tales extremos para encontrar historias lo suficientemente libres de confusión como para que interfieran entre sí. Consideremos el famoso experimento en que un fotón proveniente de una fuente puntual pasa a través de una pantalla con dos rendijas que se interpone en su camino hasta un detector. Estas dos historias interfieren y no se les puede asignar probabilidades. Carece de sentido entonces preguntarse qué rendija atravesó el fotón.

Probabilidades y apuestas

Para que quede completamente claro, hay que recalcar una vez más que, para historias lo suficientemente poco detalladas, las probabilidades que ofrece la mecánica cuántica (junto con una teoría física correcta) son las mejores que pueden calcularse. Para una secuencia de carreras, se corresponden con lo que antes hemos llamado «apuestas». Sin embargo, las apuestas reales que se hacen en un hipódromo tienen un carácter radicalmente distinto. Reflejan simplemente la opinión de los apostantes sobre las carreras futuras. Es más, las probabilidades correspondientes ni siquiera suman 1, dado que el hipódromo tiene que obtener algún beneficio de ellas.

Decoherencia para un objeto en órbita

Para ilustrar la generalidad de la decoherencia, podemos pasar de lo mundano a lo celestial en busca de otro ejemplo, la descripción aproximada de la órbita de un cuerpo en el sistema solar. Este cuerpo puede ser desde una molécula a todo un planeta; en una escala intermedia, podría ser un grano de polvo, un cometa o un asteroide. Consideremos historias no detalladas en las que se integra el destino de cualquier otro objeto del universo, así como las propiedades internas del cuerpo en cuestión, siguiendo únicamente la posición de su centro de masas. Supongamos además que tratamos esta posición aproximadamente, de manera que sólo consideramos pequeñas regiones del espacio, dentro de las cuales integramos todos los valores posibles de la posición. Finalmente, supongamos que las historias no detalladas integran todo lo que sucede la mayor parte del tiempo, de manera que siguen la posición aproximada del cuerpo celeste en una secuencia discreta de instantes separados por cortos intervalos de tiempo.

Pongamos que el cuerpo en órbita tiene una masa M, que las dimensiones lineales de las pequeñas regiones del espacio son del orden de X y los intervalos de tiempo son del orden de T. Las diferentes historias no detalladas posibles del cuerpo en el sistema solar serán decoherentes en alto grado dentro de una amplia gama de valores de M, X y T. De nuevo, el mecanismo responsable de esta decoherencia es la interacción frecuente con objetos cuyos destinos están integrados. En un conocido ejemplo, estos objetos son los fotones de la radiación cósmica de fondo, el eco de la explosión inicial del universo (el llamado Big Bang). En su órbita, nuestro cuerpo celeste topará continuamente con dichos fotones y los dispersará. Cada vez que esto sucede, el cuerpo y los fotones dispersados emergerán de la colisión con sus trayectorias alteradas. Pero las posibles direcciones y energías de los fotones están integradas, lo que elimina los términos de interferencia entre dichas direcciones y energías, y en consecuencia elimina también los términos de interferencia entre las diferentes historias no detalladas de nuestro cuerpo en órbita.

La decoherencia de las historias (que especifican las sucesivas posiciones aproximadas del centro de masas de un cuerpo en órbita en el sistema solar en instantes discretos) se debe a la repetida interacción del objeto con cosas que son integradas, como los fotones de la radiación de fondo.

Este proceso da respuesta a una pregunta que solía hacerme Enrico Fermi a principios de los años cincuenta, cuando éramos colegas en la Universidad de Chicago, si la mecánica cuántica es correcta, ¿por qué el planeta Marte no tiene una órbita difusa? La vieja respuesta de que Marte ocupa una posición definida en cada instante de tiempo porque hay personas que lo observan nos era familiar a ambos, y a los dos nos parecía estúpida. La explicación real llegó mucho después de su muerte, gracias a los trabajos de físicos teóricos como Dieter Zeh, Erich Joos y Wojtek Zurek sobre los mecanismos de decoherencia, en particular el que implica los fotones de la radiación de fondo.

Fotones procedentes del Sol son dispersados por Marte e integrados, contribuyendo a la decoherencia de las diferentes posiciones del planeta; son justamente estos fotones los que nos permiten ver Marte. La observación de Marte por parte de personas no pinta nada, mientras que el proceso físico que hace posible esta observación lo pinta todo, y podemos considerarlo como parcialmente responsable de la decoherencia de las diferentes historias no detalladas del movimiento del planeta en torno al Sol.

Las historias decoherentes forman un árbol ramificado

Los mecanismos de decoherencia hacen posible la existencia del dominio cuasiclásico en el que se desarrolla nuestra experiencia cotidiana. Este dominio está compuesto de historias no detalladas decoherentes, que se pueden imaginar formando una estructura ramificada. En uno de los brillantes cuentos de Borges, se representa esta estructura como un «jardín de senderos que se bifurcan». En cada ramificación nos encontramos con alternativas mutuamente excluyentes. A menudo, estas ramificaciones han sido comparadas con bifurcaciones en una carretera, como en el poema de Robert Frost «The Road not Taken» [El camino no tomado].

La estructura comienza a ramificarse en posibilidades alternativas en el mismo momento, o justo después, del inicio de la expansión del universo. Cada rama se divide de nuevo al poco tiempo en más posibilidades, y así sucesivamente en todo momento. En cada ramificación hay probabilidades bien definidas para las diferentes alternativas. No hay interferencias cuánticas entre ellas.

Una buena ilustración la encontramos de nuevo en el hipódromo. Cada carrera implica una ramificación entre diez posibles alternativas para los diferentes ganadores, y a partir de cada ganador hay otra ramificación en diez alternativas posibles para el ganador de la carrera siguiente.

En el hipódromo, el resultado de una carrera no suele ejercer una gran influencia sobre las probabilidades en la siguiente (por ejemplo, un jinete deprimido por haber perdido la carrera anterior). Sin embargo, en el árbol ramificado de las historias alternativas del universo, el resultado de una bifurcación puede afectar profundamente las probabilidades en las bifurcaciones subsiguientes, e incluso la naturaleza de las posibles alternativas. Por ejemplo, la condensación de materia que formó el planeta Marte podría depender de un accidente cuántico ocurrido hace miles de millones de años; en aquellas bifurcaciones en las que dicho planeta no apareció, no se darían las ramificaciones posteriores relacionadas con los destinos alternativos de Marte.

La estructura ramificada de las historias no detalladas decoherentes alternativas del universo es diferente de los árboles evolutivos propios de los lenguajes humanos o las especies biológicas. En el caso de los árboles evolutivos, todas las ramas se encuentran presentes en el mismo registro histórico. Por ejemplo, todas las lenguas romances surgen de una versión tardía del latín, pero no son en absoluto alternativas. Francés, español, portugués, italiano, catalán y otras lenguas que se hablan en la actualidad, y las actualmente extintas, como el dálmata, se hablaron en algún momento. Por contra, las ramas del árbol de las historias decoherentes alternativas son mutuamente excluyentes, y sólo una de ellas es accesible a un observador. Ni siquiera los divulgadores de los trabajos de Hugh Everett que hablan de múltiples mundos ramificados igualmente reales afirman haber observado más de uno de ellos.

Alta inercia y comportamiento casi clásico

La decoherencia por sí sola (que da lugar a una ramificación de historias alternativas dotadas de probabilidades bien definidas) no es la única propiedad importante del dominio cuasiclásico que incluye la experiencia cotidiana. Este dominio exhibe también un comportamiento en gran medida clásico —de ahí la denominación «cuasiclásico»—. No sólo las posiciones sucesivas del planeta Marte en una secuencia discreta de instantes tienen unas probabilidades bien definidas. Las posiciones en cada instante están también altamente correlacionadas entre sí (probabilidades extremadamente próximas a uno) y se corresponden, con una enorme aproximación, con la órbita bien definida en torno al Sol predicha por la física clásica. Esta órbita obedece las ecuaciones de Newton para el movimiento en el campo gravitatorio creado por el Sol y los otros planetas, con pequeñas correcciones dadas por la teoría clásica mejorada de Einstein (la relatividad general) y una pequeña fuerza de fricción causada por colisiones con objetos ligeros, como los fotones de la radiación de fondo. Recordemos que estos objetos son integrados e ignorados en las historias no detalladas que siguen el movimiento de Marte, y que esto es la causa de su decoherencia.

¿Cómo puede un planeta seguir una órbita clásica determinista cuando se ve constantemente azotado en su camino por rachas aleatorias de fotones? Es posible porque el objeto en órbita es muy grande; cuando más masivo sea, con menor probabilidad exhibirá un comportamiento errático y seguirá más plácidamente su trayectoria. La masa M del planeta, su inercia, resiste este constante abofeteo y le permite comportarse clásicamente con una buena aproximación. Un átomo o una molécula son demasiado ligeros para seguir una trayectoria consistente en presencia de todos los objetos del sistema solar con los que colisionarían. Un grano de arena grande es lo suficientemente masivo como para seguir una órbita bastante bien definida, y una pequeña nave espacial lo hace aún mejor. Pero hasta una astronave resulta afectada por el viento solar, compuesto de electrones emitidos por el Sol. Las colisiones de esos electrones con la nave podrían bastar para perturbar ciertos experimentos delicados destinados a probar la teoría einsteniana de la gravitación; por esta razón, sería deseable realizar estos experimentos valiéndose de un radar emplazado en Marte y no sobre una sonda espacial.

Aunque hemos asociado el comportamiento cuasiclásico con la masa de los objetos, sería más exacto adscribirlo a los movimientos cuya inercia es lo suficientemente grande. Un baño de helio líquido ultrafrío puede ser grande y pesado y en cambio exhibir extraños efectos cuánticos, como derramarse por encima del borde de un recipiente abierto, debido a que sus movimientos internos tienen poca inercia.

Fluctuaciones

Los físicos distinguen entre fluctuaciones cuánticas y clásicas; un ejemplo de estas últimas serían las fluctuaciones térmicas asociadas con el movimiento de las moléculas en un gas caliente. La baja resolución necesaria para lograr la decoherencia en mecánica estadística implica la integración sobre muchas variables, entre las que fácilmente pueden figurar algunas de las que describen tales movimientos moleculares. Las fluctuaciones clásicas tienden así a confundirse con las cuánticas. Un objeto masivo que siga una órbita clásica definida resiste los efectos de ambos tipos de fluctuaciones a la vez. Análogamente, un objeto más ligero puede resultar significativamente afectado por ambos.

El movimiento errático causado por reiteradas colisiones con cosas muy pequeñas fue descubierto a principios del siglo XIX por el botánico Robert Brown, en cuyo honor este fenómeno recibe el nombre de movimiento browniano. Se puede observar fácilmente dejando caer una gota de tinta en un recipiente con agua y mirando con un microscopio el comportamiento de los gránulos de pigmento. Einstein explicó estos movimientos bruscos por las fluctuaciones en las colisiones de las partículas con las moléculas de agua, una interpretación que por primera vez hacía a las moléculas susceptibles de observación experimental.

El gato de Schrödinger

En el dominio cuasiclásico, los objetos obedecen aproximadamente las leyes de la mecánica clásica. Se encuentran sujetos a fluctuaciones, pero éstas son sucesos individuales superpuestos a un patrón de comportamiento clásico. Sin embargo, una vez se produce una fluctuación en la historia de un objeto por lo demás clásico ésta puede verse arbitrariamente amplificada. Un microscopio puede aumentar la imagen de una partícula de tinta golpeada por una molécula y una fotografía puede preservar la imagen ampliada indefinidamente.

Esto nos trae a la memoria el famoso experimento mental del gato de Schrödinger, en el cual un suceso cuántico es amplificado de manera que decide si un gato resulta envenenado o no. Tal amplificación, aunque poco agradable, es perfectamente posible. Puede diseñarse un mecanismo de forma que la vida del gato dependa, por ejemplo, de la dirección que tome una partícula emitida por la desintegración de un núcleo atómico. (Empleando un arma termonuclear, podría decidirse de igual manera el destino de una ciudad.)

La discusión clásica sobre el gato de Schrödinger se basa en la interferencia cuántica entre los escenarios del gato vivo y del gato muerto. Sin embargo, el gato vivo interacciona de modo considerable con el resto del universo —a través de su respiración, por ejemplo— e incluso el gato muerto interactúa hasta cierto punto con el aire. No sirve de nada encerrar al felino en una caja, porque la caja interactúa con el resto del universo, así como con el gato. De modo que hay abundantes oportunidades para la decoherencia entre las historias no detalladas en las que el gato vive y en las que muere. Los escenarios en los que el gato vive y aquellos en los que muere son decoherentes, no hay interferencia entre ellos.

Es tal vez este aspecto de la interferencia en la historia del gato lo que hace exclamar a Stephen Hawking, «Cuando oigo hablar del gato de Schrödinger, echo mano a mi pistola». Esta frase es en cualquier caso una parodia de otra que suele atribuirse a algún líder nazi, pero que de hecho aparece en la obra de teatro Schlageter, de Hanns Johst, «Cuando oigo la palabra Kultur, le quito el seguro a mi Browning».

Supongamos que el suceso cuántico que determina el destino del gato ha ocurrido ya; no sabremos lo que ha pasado hasta que destapemos la caja que encierra al animal. Dado que los dos resultados posibles son decoherentes, la situación no difiere del caso clásico en el que abrimos la caja que contiene a un pobre animal después de un largo viaje, tras el que no sabemos si está vivo o muerto. Se han gastados resmas de papel acerca del supuestamente misterioso estado cuántico del gato, vivo y muerto al mismo tiempo. Ningún objeto cuasiclásico real puede mostrar tal comportamiento, porque su interacción con el resto del universo conducirá a la decoherencia de las posibles alternativas.

Descenso de resolución adicional necesario para la inercia y la cuasiclasicidad

Un dominio cuasiclásico requiere, de manera natural, historias lo suficientemente poco detalladas para ser decoherentes con una muy buena aproximación; también requiere que sean aún menos detalladas, de modo que lo que se sigue en las historias tenga inercia suficiente como para resistir las inevitables fluctuaciones asociadas con lo que se integra. Aquí persisten continuas excursiones pequeñas fuera del comportamiento clásico y, ocasionalmente, grandes.

La razón por la que la alta inercia requiere un descenso de resolución adicional es que los fragmentos apreciables de materia pueden entonces ser seguidos y tener grandes masas. (Si existiesen algunas partículas elementales de gran masa que fuesen estables o cuasiestables, representarían una fuente distinta de alta inercia. Todavía no se ha encontrado ninguna partícula semejante, aunque podrían existir y, si así fuese, podrían haber jugado un importante papel en los instantes iniciales de la expansión del universo.)

Situaciones de medida y medidas

Un suceso cuántico puede correlacionarse totalmente con algo perteneciente al dominio cuasiclásico. Esto es lo que sucede en la parte sensata de la historia del gato, en la que un suceso de este tipo se correlaciona con el destino del animal. Un ejemplo más simple y menos caprichoso sería un núcleo radiactivo, presente como impureza en un cristal de mica, que se desintegra, pongamos por caso, en dos fragmentos eléctricamente cargados que se mueven en direcciones opuestas. La dirección del movimiento de uno de los fragmentos está por completo indeterminada hasta que se produce la desintegración, pero a partir de entonces se correlaciona perfectamente con el rastro que deja en la mica. Las historias cuasiclásicas, que integran cosas como la radiación blanda emitida al formarse el rastro en el cristal, producen la decoherencia de las diferentes direcciones, con una pequeña dispersión. Estos rastros, a temperaturas ordinarias, pueden durar decenas de miles de años y, por supuesto, la mera persistencia es un ejemplo (aunque trivial) de historia clásica. La desintegración radiactiva ha contactado así con el dominio cuasiclásico.

La acumulación de rastros dejados por los productos de la desintegración espontánea de núcleos fisibles se emplea en ocasiones para datar minerales. Este método se conoce como datación radiactiva, y puede aplicarse a rocas de cientos de miles de años de antigüedad. Imaginemos que un científico que realiza una medición de este tipo estudia un rastro en particular. Mientras procede a la datación, puede decirse que también está midiendo la dirección de la desintegración de un núcleo radiactivo. Sin embargo, el rastro ha estado allí desde que se formó; no comenzó a existir cuando el físico le echó una mirada (como sugeriría alguna descripción torpe de la mecánica cuántica). Ha existido una situación susceptible de medida desde que el núcleo se desintegró y se formó el rastro, esto es, desde que se estableció una fuerte correlación con el dominio cuasiclásico. La medición podría llevarla a cabo una cucaracha u otro sistema complejo adaptativo cualquiera. Consiste en «percatarse» de que se ha producido una alternativa particular de entre un conjunto de alternativas decoherentes, dotadas de diferentes probabilidades. Ocurre exactamente lo mismo en el hipódromo cuando se «observa» que un caballo en particular ha ganado la carrera. Un registro de la victoria, ya presente en algún lugar del dominio cuasiclásico, es registrado además en la memoria del observador, sea éste de inteligencia elevada o pequeña. No obstante, muchos autores sensatos, incluso brillantes, han apelado a la importancia de la conciencia humana en el proceso de medida. ¿Es realmente tan importante? ¿Qué significa realmente notar y observar?

IGUS: Un sistema complejo adaptativo como observador

En este contexto, una observación es como una poda del árbol de historias ramificadas. En una bifurcación concreta, sólo se preserva una de las ramas (más precisamente, sobre cada rama, sólo se preserva ¡esa misma rama!). Las ramas podadas se eliminan, junto con las partes del árbol que crecen a partir de las ramas podadas.

En cierto sentido, el cristal de mica con trazas de desintegración radiactiva ha realizado ya una operación de poda, registrando la dirección real del movimiento del fragmento de núcleo y descartando todas las otras direcciones posibles. Pero un sistema complejo adaptativo que observe el rastro realiza la poda de una forma más explícita, incorporando la observación en el flujo de datos que da lugar a la evolución de sus esquemas. El consiguiente comportamiento del sistema puede entonces reflejar su observación de la dirección particular del rastro.

Un sistema complejo adaptativo que actúa como un observador merece probablemente un buen nombre. Jim Hartle y yo lo llamamos IGUS (Information Gathering and Utilizing System), es decir, sistema acumulador y utilizador de información. Si el IGUS tiene un grado significativo de conciencia o conocimiento de sí mismo (de modo que se percibe a sí mismo percibiendo la dirección del rastro radiactivo) tanto mejor, pero ¿es esto necesario? ¿Tiene realmente una medida hecha por un ser humano cualquiera, aunque sea uno muy estúpido, mayor significado que la hecha por un gorila o un chimpancé? Y si no es así, ¿por qué no sustituir al simio por una chinchilla o una cucaracha?

Al comenzar a podar el árbol de historias ramificadas, tal vez habría que distinguir entre un observador humano que sabe algo sobre mecánica cuántica (y así conoce el origen del árbol) y cualquier otro que no sabe nada. En cierto sentido, la diferencia entre ellos es mayor que entre un humano ignorante de la mecánica cuántica y una chinchilla.

Un IGUS puede hacer algo más que eliminar ramas alternativas cuando ya es conocido el resultado de un suceso determinado, puede apostar de antemano sobre dicho resultado, utilizando alguna versión aproximada de las probabilidades que proporciona la mecánica cuántica. Sólo un sistema complejo adaptativo puede hacer eso. A diferencia de un cristal de mica, un IGUS puede incorporar sus propias probabilidades estimadas de sucesos futuros en un esquema, y basar su comportamiento futuro en dicho esquema. Por ejemplo, un mamífero que habite en el desierto puede emprender un largo camino hacia un pozo profundo algunos días después de que haya llovido, pero no se dirigirá hacia uno poco profundo, porque es más probable que haya agua en el primero que en el segundo.

La poda de ramas sustituye a lo que se denomina «colapso de la función de onda» en la interpretación tradicional de la mecánica cuántica. Ambas descripciones pueden relacionarse matemáticamente, pero el colapso se presenta a menudo como un fenómeno misterioso propio de la mecánica cuántica. Dado que la poda representa simplemente el reconocimiento de la ocurrencia de una de entre un conjunto de alternativas decoherentes, nos resulta más familiar. Un ejemplo es la constatación de que, después de todo, no me fui a París, sino que me quedé en casa. Todas las ramas de la historia que dependían de mi partida a París han sido descartadas; sus probabilidades son ahora nulas, fuera cual fuese antes su valor.

El punto confuso que resta en las discusiones sobre el llamado colapso es que aunque la poda implique la medida de un suceso cuántico, continúa siendo una simple discriminación entre alternativas decoherentes. Los sucesos cuánticos sólo pueden detectarse al nivel del dominio cuasiclásico. Ahí la situación es la de unas probabilidades clásicas, como en el lanzamiento de un dado o una moneda, que se hacen cero o uno cuando se conoce el resultado. El dominio cuasiclásico admite la posibilidad de un registro razonablemente persistente del resultado, registro que puede ampliarse o copiarse una y otra vez en una cadena cuasiclásica de concordancia casi exacta entre un registro y el precedente. Una vez que un suceso cuántico queda correlacionado con el dominio cuasiclásico (creando una situación susceptible de medida), el resultado particular del suceso en una rama histórica dada se convierte en un hecho.

Conciencia de uno mismo y libre albedrío

Ya que hemos mencionado el tema de la conciencia, vamos a explorarlo brevemente un poco más. El cerebro humano tiene unos lóbulos frontales muy grandes comparados con los de nuestros parientes cercanos los grandes simios. Los neurobiólogos han identificado en ellos áreas que parecen estar relacionadas con la conciencia y la voluntad, y se piensa que están especialmente bien desarrolladas en los seres humanos.

Junto a los muchos procesos que operan en paralelo en la mente humana, la conciencia parece referirse a un proceso secuencial, una especie de foco que puede pasar de una idea o impresión sensorial a otra, en rápida sucesión. Cuando pensamos que prestamos atención a muchas cosas a la vez, en realidad estamos empleando este foco a tiempo compartido, desplazándolo entre los diferentes objetos de nuestra atención. Las diferentes líneas de proceso en paralelo difieren en su accesibilidad al pensamiento consciente, y algunas de las fuentes del comportamiento humano yacen enterradas en niveles profundos del pensamiento desde donde es difícil que accedan a la conciencia.

A pesar de ello, afirmamos que la expresión oral y otros actos están, en considerable grado, bajo un control consciente, y esto refleja no sólo el reconocimiento del faro de la conciencia, sino nuestra profunda creencia en que poseemos libre albedrío, que podemos escoger entre distintas alternativas de comportamiento.

¿Qué tipo de fenómenos objetivos producen esa impresión tan subjetiva que es el libre albedrío? Decir que una decisión se toma libremente significa que no está estrictamente determinada por todo lo que ha sucedido anteriormente. ¿De dónde surge esta aparente indeterminación?

Una explicación posible es que está conectada con indeterminaciones fundamentales, probablemente la propia de la mecánica cuántica realzada por fenómenos clásicos como el caos. Una decisión humana tendría así un carácter impredictible, y podría decirse retrospectivamente que ha sido tomada libremente. No obstante, uno podría preguntarse cuáles son los rasgos distintivos del córtex cerebral humano que hacen que las contribuciones de las fluctuaciones cuánticas y el caos sean tan preponderantes.

En lugar de invocar sólo estos factores puramente físicos, podríamos considerar también procesos más directamente asociados con el cerebro y la mente. Recordemos que, para una resolución dada, todos los fenómenos accesorios pueden contribuir con indeterminaciones aparentes (por ejemplo fluctuaciones térmicas) que se suman a las fluctuaciones cuánticas. Dado que hay siempre muchos procesos mentales no iluminados por el faro de la conciencia, estos procesos se integran en las historias extremadamente poco detalladas que recordamos conscientemente. Las indeterminaciones resultantes contribuirían más verosímilmente a la impresión subjetiva de libre albedrío que las indeterminaciones más estrechamente asociadas con la física. En otras palabras, los seres humanos probablemente actúan impulsados por motivaciones ocultas con mayor frecuencia que por un generador interno de números aleatorios o pseudoaleatorios. Pero todas estas cuestiones están muy mal comprendidas y, por ahora, lo único que podemos hacer es especular. (Las especulaciones sobre esta materia no son ni mucho menos recientes. Con todo, no veo ninguna razón por la cual estas cuestiones no debieran tratarse en el marco de una investigación científica sobre el posible papel de las indeterminaciones en el funcionamiento del córtex cerebral humano y los correspondientes procesos mentales.)

¿Qué caracteriza el dominio cuasiclásico familiar?

En las historias no detalladas que incorporan las experiencias cotidianas dentro del dominio cuasiclásico, se siguen ciertas clases de variables, mientras que el resto se integra, es decir, se ignora. En pocas palabras, el dominio cuasiclásico usual obedece las leyes de la gravedad y el electromagnetismo, y las leyes de conservación de magnitudes como la energía, el momento o la carga eléctrica, junto con otras que se conservan aproximadamente, como el número de dislocaciones (irregularidades) producidas en un cristal por el paso de una partícula cargada. Se dice que una magnitud se conserva cuando la cantidad total de ésta presente en un sistema cerrado permanece invariable con el tiempo; se conserva aproximadamente cuando la cantidad total apenas varía con el tiempo. Una magnitud conservada como la energía no puede crearse ni destruirse, sólo transformarse. Las dislocaciones en un cristal pueden obviamente crearse, por ejemplo por el paso de una partícula cargada; sin embargo, pueden durar cientos de miles de años una vez creadas, y en este sentido son cuasiconservadas.

El dominio cuasiclásico familiar implica la integración de todo menos ciertos rangos de valores de los campos electromagnético y gravitatorio y de las magnitudes conservadas y cuasiconservadas, dentro de volúmenes de espacio pequeños pero lo bastante grandes como para tener la inercia necesaria para resistir las fluctuaciones asociadas con los efectos de las variables integradas. Es decir, la resistencia a las fluctuaciones es suficiente para que las magnitudes que se siguen manifiesten un comportamiento cuasiclásico.

Estas magnitudes deben seguirse a intervalos de tiempo no demasiado estrechos, para que las historias no detalladas puedan ser decoherentes. En general, si la resolución es demasiado alta (debido a intervalos de tiempo demasiado cortos, volúmenes demasiado pequeños o rangos de magnitudes demasiado estrechos), el peligro de interferencia entre historias se hace mayor.

Consideremos un conjunto de historias no detalladas alternativas refinadas al máximo, de manera que cualquier aumento de resolución arruinaría la decoherencia, el carácter cuasiclásico de las historias o ambas cosas a la vez. Los pequeños volúmenes de espacio en los cuales se siguen, a intervalos de tiempo apropiados, las magnitudes conservadas y cuasiconservadas pueden cubrir entonces todo el universo, pero con una resolución espaciotemporal (y de los rangos de las magnitudes) adecuada para producir la decoherencia y dar como resultado historias alternativas cuasiclásicas.

La experiencia humana y de los sistemas con los que estamos en contacto es la de un dominio de mucha menor resolución que este dominio cuasiclásico maximal que acabamos de describir. Se requiere una gran pérdida de detalle para pasar del dominio cuasiclásico maximal al dominio accesible a nuestra experiencia cotidiana. Nuestro dominio accesible cubre únicamente regiones muy limitadas del espacio-tiempo, y el alcance de sus variables es muy corto. (El interior de las estrellas y de otros planetas, por ejemplo, resulta prácticamente inaccesible, y lo que ocurre en la superficie sólo puede detectarse de una manera no detallada.)

Por contra, las historias no detalladas del dominio cuasiclásico maximal no tienen por qué integrar, y por tanto ignorar, todas las variables inaccesibles a la observación humana. En su lugar, esas historias pueden incluir descripciones de resultados alternativos de procesos arbitrariamente remotos en el espacio y en el tiempo. Pueden incluso abarcar sucesos cerca del inicio de la expansión del universo, cuando presumiblemente no existían sistemas complejos adaptativos que pudiesen actuar como observadores.

En suma, un dominio cuasiclásico maximal es un conjunto exhaustivo de historias no detalladas del universo mutuamente excluyentes que cubren todo el espacio-tiempo, que son mutuamente decoherentes y cuasiclásicas la mayor parte del tiempo, y que poseen la máxima resolución compatible con las otras condiciones. En este tipo particular de dominio cuasiclásico maximal, las magnitudes que se siguen son rangos de valores de magnitudes conservadas y cuasiconservadas integradas sobre pequeños volúmenes. El dominio de la experiencia humana cotidiana se obtiene a partir de estos dominios maximales reduciendo de modo extremo la resolución, en correspondencia con las posibilidades de nuestros sentidos e instrumentos.

La dependencia histórica de las magnitudes que se siguen

Es importante hacer hincapié en que las magnitudes específicas que se siguen en un instante dado pueden depender del resultado de las ramificaciones previas de las historias. Por ejemplo, la distribución de masa de la Tierra, representada por la cantidad de energía contenida en cada uno de un gran número de pequeños volúmenes que componen el planeta, podría seguirse en una historia no detallada siempre y cuando la Tierra exista. ¿Pero qué ocurriría si la Tierra explotase algún día en pedacitos, a causa de alguna catástrofe imprevista? ¿Qué pasaría si esta catástrofe volatilizase el planeta, como en algunas películas de serie B? Presumiblemente, en las historias en las que esto ocurra las magnitudes que se siguen serán muy diferentes antes y después de la catástrofe. En otras palabras, las magnitudes que se siguen en historias de una resolución dada pueden depender de las ramificaciones de las mismas.

Objetos individuales

Hemos discutido el dominio cuasiclásico que incluye la experiencia cotidiana en términos de rangos de valores de campos y de magnitudes conservadas o cuasiconservadas en pequeños volúmenes de espacio. Pero ¿qué ocurre cuando entran en escena objetos individuales como un planeta?

Al principio de la historia del universo, las masas de materia comenzaron a condensarse bajo la influencia de la atracción gravitatoria. El contenido de las diversas historias no detalladas alternativas posteriores es mucho más conciso cuando se describe en términos de los objetos de nueva formación. Es mucho más simple registrar el movimiento de una galaxia que listar por separado todos los cambios en la densidad de materia de un billón de billones de pequeños volúmenes de espacio a medida que la galaxia se mueve.

Cuando las galaxias dieron origen a estrellas, planetas, rocas y, en algunos lugares, a sistemas complejos adaptativos como los seres vivos de la Tierra, la existencia de objetos individuales se convirtió en una característica cada vez más marcada del dominio cuasiclásico. Muchas de las regularidades del universo pueden describirse con mucha más concisión en términos de estos objetos; las propiedades de las cosas individuales representan una gran proporción de la complejidad efectiva del universo.

En la mayor parte de casos, la descripción de objetos individuales es más simple cuando su definición permite el aumento o la pérdida de cantidades de materia comparativamente pequeñas. Cuando un planeta absorbe un meteorito o un gato respira, la identidad del planeta o el gato no se alteran.

¿Cómo puede medirse la individualidad? Una forma consiste en observar un conjunto de objetos comparables y, para una cierta resolución, describir de la manera más breve posible las propiedades que los distinguen (tales como las plumas perdidas de los once cóndores de California que contemplé encima del ternero). El número de bits en la descripción de un individuo típico puede entonces compararse con la cantidad necesaria para enumerar a los individuos del conjunto. Si, para una resolución particular, la descripción contiene muchos más bits que la enumeración, entonces los objetos del conjunto muestran individualidad.

Consideremos el conjunto de todos los seres humanos, en la actualidad cerca de 5 500 millones. Asignar un número diferente a cada persona requiere unos 32 bits, porque 2 multiplicado 32 veces por sí mismo es igual a 4 294 967 296. Pero incluso un simple vistazo, acompañado de una breve entrevista, revelerá fácilmente muchísimo más de 32 bits de información sobre una persona. Cuando la estudiemos más de cerca revelerá una individualidad aún mayor. E imaginemos de cuánta información adicional dispondremos cuando pueda leerse su genoma individual.

El número de estrellas en nuestra galaxia, sin contar posibles astros oscuros que los astrónomos puedan descubrir algún día, se eleva a unos cien mil millones. Asignar a cada una un número consecutivo requería unos 37 bits. Los astrónomos han obtenido del Sol, la estrella más cercana, una cantidad de información muy superior a ésta, pero la resolución es muy inferior para las otras estrellas. La posición en el cielo, la luminosidad, el espectro de emisión y el movimiento pueden medirse de alguna forma, con mayor o menor precisión según la distancia. El número total de bits de información no suele ser muy superior a 37, y en algunos casos es inferior. Tal como las ven los astrónomos en la actualidad, las estrellas, exceptuando el Sol, tienen alguna individualidad, pero no mucha.

La baja resolución característica de las observaciones actuales puede evitarse pasando a un dominio cuasiclásico maximal, consistente en historias alternativas que cubren todo el espacio- tiempo, y que no sólo son decoherentes y casi clásicas, sino también, en algún sentido, de máxima resolución, dada su decoherencia y carácter cuasiclásico. Cuando resulta apropiado, estas historias pueden expresarse en términos de objetos individuales, que pueden seguirse con extraordinario detalle y exhiben, en correspondencia, un alto grado de individualidad.

En el dominio cuasiclásico maximal ordinario, la información disponible sobre cualquier estrella es enormemente mayor que la que poseemos sobre el Sol. Análogamente, la información sobre cualquier ser humano es mucho más rica que la disponible en la actualidad. De hecho, ningún sistema complejo adaptativo que observase una estrella o un hombre en este dominio podría hacer uso de tan gigantesca cantidad de información. Por otra parte, la mayor parte de los datos se referiría a fluctuaciones aleatorias o pseudoaleatorias de la densidad de materia en el núcleo de la estrella o en el interior de algún hueso o músculo. Resulta difícil imaginar qué uso podría hacer un sistema complejo adaptativo de esta masa de información. A pesar de ello, las regularidades en los datos podrían ser muy útiles; de hecho, los médicos se sirven de tales regularidades cuando emplean la resonancia magnética nuclear (RMN) o la tomografía axial computerizada (TAC) para diagnosticar una enfermedad. Como siempre, un esquema descriptivo formulado por un sistema complejo adaptativo observador es una lista concisa de regularidades, y la longitud de dicha lista es una medida de la complejidad efectiva del objeto observado.

El carácter proteico de la mecánica cuántica

Al igual que las probabilidades clásicas que surgen en una serie de carreras de caballos, las historias alternativas no detalladas del universo que constituyen el dominio cuasiclásico maximal forman una estructura ramificada, con probabilidades bien definidas para las diferentes posibilidades en cada bifurcación. Entonces, ¿en qué difiere la mecánica cuántica de la mecánica clásica? Una diferencia obvia es que, en mecánica cuántica, la baja resolución es necesaria para que la teoría produzca resultados útiles, mientras que en mecánica clásica obedece a la imprecisión en las medidas u otras limitaciones de orden práctico. Pero existe otra diferencia, de mayor entidad, responsable de la naturaleza no intuitiva de la mecánica cuántica: su carácter proteico. Recordemos que Proteo, en la mitología clásica, era un adivino reticente que tenía el don de transformarse en diferentes criaturas. Para obtener predicciones de él, era necesario sujetarlo firmemente mientras cambiaba de forma sin cesar.

Retomemos a nuestras historias detalladas de un universo simplificado, que especifican la posición de cada partícula del mismo en todo momento. En mecánica cuántica, la posición es una elección arbitraria. Mientras que el principio de incertidumbre de Heisenberg imposibilita especificar simultáneamente la posición y el momento de una partícula dada con precisión arbitraria, no impide especificar el momento en lugar de la posición. En consecuencia, las historias detalladas pueden escogerse de muchas formas distintas, cada partícula caracterizada en ciertos instantes por su momento, y el resto del tiempo por su posición. Por otra parte, existe una infinita variedad de formas, más sutiles, de construir historias detalladas del universo.

¿Hay muchos dominios cuasiclásicos no equivalentes?

Para cada uno de estos conjuntos de historias detalladas es posible considerar muchas formas de eliminar información y preguntar cuáles, si es que las hay, conducen a un dominio cuasiclásico maximal caracterizado por historias no detalladas decoherentes que exhiban un comportamiento casi clásico, con continuas excursiones pequeñas y, ocasionalmente, alguna notable. Además, podemos preguntamos si existen distinciones realmente significativas entre estos dominios o si todos son más o menos equivalentes.

Jim Hartle y yo, entre otros, estamos intentando dar respuesta a esta cuestión. A menos que se demuestre lo contrario, siempre será concebible que haya un gran conjunto de dominios cuasiclásicos no equivalentes, de los cuales el que nos es familiar no es más que un ejemplo. Si ello es cierto, ¿qué distingue el dominio cuasiclásico familiar de todos los demás?

Quienes se adhieran a la visión temprana de la mecánica cuántica podrían pensar que los seres humanos hemos decidido medir ciertas magnitudes y que nuestra elección determina el dominio cuasiclásico con que nos enfrentamos. O, con un poco más de generalidad, podrían decir que los seres humanos sólo son capaces de medir ciertos tipos de magnitudes, y que el dominio cuasiclásico debe basarse, al menos en parte, en ellas.

Un lugar para los sistemas complejos adaptativos

El carácter cuasiclásico garantiza a todos los seres humanos, y a todos los sistemas en contacto con nosotros, la posibilidad de comparar registros, de forma que todos nos referimos siempre al mismo dominio. Pero ¿hemos seleccionado colectivamente este dominio? Tal punto de vista puede resultar innecesariamente antropocéntrico, como otros aspectos de la interpretación anticuada de la mecánica cuántica.

Otra aproximación menos subjetiva consiste en partir de un dominio cuasiclásico maximal y reparar en que a lo largo de determinadas ramas, en ciertas épocas y lugares, puede mostrar la característica mezcla de regularidad y azar que favorece la evolución de los sistemas complejos adaptativos. El comportamiento casi clásico proporciona la regularidad, mientras que las excursiones fuera del determinismo —las fluctuaciones— proporcionan el elemento aleatorio. Los mecanismos de amplificación, entre ellos el caos, permiten que algunas de estas fluctuaciones aleatorias lleguen a correlacionarse con el dominio cuasiclásico y den lugar a ramificaciones. Por ello, cuando los sistemas complejos adaptativos evolucionan, lo hacen en conexión con un dominio cuasiclásico particular, que no ha de considerarse como algo elegido por los sistemas de acuerdo a sus capacidades. En vez de eso, la localización y las capacidades de los sistemas determinan el descenso de resolución adicional (en nuestro caso, muy grande) que se aplica a un dominio cuasiclásico maximal particular para llegar al dominio percibido por los sistemas.

Supongamos que la mecánica cuántica del universo permitiese matemáticamente la existencia de varios dominios cuasiclásicos maximales posibles, genuinamente no equivalentes. Supongamos, también, que los sistemas complejos adaptativos evolucionasen realmente para explotar cierta disminución de resolución en cada uno de estos dominios. Cada dominio proporcionaría entonces un conjunto de historias no detalladas alternativas del universo, y los sistemas acumuladores y procesadores de información (IGUS) registrarían en cada caso los resultados de varias ramificaciones probabilísticas dentro del árbol de historias posibles, ¡un árbol que sería bien diferente en cada caso!

Si existiese algún grado de concordancia en los fenómenos que se siguen en cada dominio cuasiclásico distinto, los diferentes IGUS podrían percibirse mutuamente, e incluso comunicarse de alguna forma. Pero una gran parte de lo que es seguido por un IGUS no puede ser aprehendido de forma directa por los otros. Sólo por medio de mediciones o cálculos mecanocuánticos podría un IGUS hacerse alguna idea de todo el dominio de fenómenos que percibe otro distinto (esto podría recordar a alguien la relación entre hombres y mujeres).

¿Podría un observador dentro de cierto dominio llegar a ser realmente consciente de que hay otros dominios, con sus propios conjuntos de historias ramificadas y observadores, disponibles como descripciones alternativas de las posibles historias del universo? Este fascinante tema ha sido tratado por los escritores de ciencia ficción (que a veces emplean la expresión «mundos de duendes», de acuerdo con el teórico ruso Starobinsky), pero sólo ahora está mereciendo la atención de los teóricos de la mecánica cuántica.

Los que trabajamos en la construcción de una interpretación moderna de la mecánica cuántica tenemos como objetivo poder dar por finalizada la era regida por el dicho de Niels Bohr: «Si alguien dice que puede pensar en la mecánica cuántica sin sentir vértigo, entonces es que no ha entendido nada de nada».

Capítulo 12
Mecánica cuántica y verborrea

Aunque muchas cuestiones sobre la mecánica cuántica todavía no tienen una respuesta satisfactoria, no hay necesidad de introducir mistificaciones innecesarias donde de hecho no existe ningún problema. Sin embargo, esto es lo que se ha hecho en un gran número de escritos recientes sobre mecánica cuántica.

Como esta disciplina sólo predice probabilidades, en algunos círculos se piensa que la mecánica cuántica permite que ocurra prácticamente cualquier cosa. ¿Es eso cierto? Todo depende de si se toman en consideración sucesos de una probabilidad pequeñísima. Recuerdo que cuando era estudiante me propusieron el problema de calcular la probabilidad de que un objeto macroscópico masivo se elevase un metro en el aire durante un cierto tiempo como consecuencia de una fluctuación cuántica. La respuesta era, aproximadamente, uno dividido por un número con sesenta y dos ceros. La finalidad del problema era enseñamos que en la práctica no hay diferencia entre una probabilidad así y cero. Algo tan improbable resulta, de hecho, imposible.

Cuando nos fijamos en las cosas que pueden pasar en la realidad con una probabilidad significativa, encontramos que muchos fenómenos que resultaban imposibles en el marco de la física clásica continúan siéndolo en el universo cuántico. Sin embargo, la comprensión de esto por parte del público se ha visto dificultada en los últimos años por una fiebre de libros y artículos con referencias equívocas a ciertos elegantes desarrollos teóricos obra de John Bell y a los resultados de un experimento relacionado con ellos. Algunas de las referencias a este experimento, que implica dos fotones que se mueven en direcciones opuestas, han dado a los lectores la falsa impresión de que la medida de las propiedades de uno de los fotones afecta instantáneamente las del otro. La conclusión que se extrae es que la mecánica cuántica permite la comunicación a mayor velocidad que la luz. ¡Incluso se ha llegado a decir que hace plausibles fenómenos «paranormales» como la precognición! ¿Cómo se ha llegado a esta situación?

Las objeciones de Einstein a la mecánica cuántica

En cierto modo, la historia parte de la actitud de Einstein hacia la mecánica cuántica. Aunque colaboró en la preparación del camino que conduciría hasta ella a principios de siglo con su brillante trabajo sobre los fotones, en el que por primera vez tomó en consideración la hipótesis cuántica original de Max Planck, a Einstein nunca le gustó la mecánica cuántica en sí misma. En la Conferencia Solvay de 1930 en Bruselas, Einstein presentó lo que pretendía ser una demostración de la inconsistencia de la mecánica cuántica. Niels Bohr y sus aliados trabajaron frenéticamente en los días siguientes para encontrar el fallo en el argumento de aquel gran hombre. Antes del fin de las sesiones, pudieron demostrar que Einstein había omitido algo; curiosamente, su olvido había sido precisamente la relatividad general. Cuando concluyó la conferencia, la alegada inconsistencia había desaparecido.

Después de aquello, Einstein abandonó sus intentos de probar que la mecánica cuántica era internamente inconsistente. En lugar de eso, se concentró en identificar el principio que esta disciplina violaba y que, según él creía, debía obedecer cualquier marco teórico correcto. En 1935, junto con dos jóvenes colaboradores, Podolsky y Rosen, publicó un artículo en el que describía dicho principio y un experimento hipotético en el que la mecánica cuántica dejaría de satisfacerlo. El principio, que él llamó «de completitud», desafiaba la naturaleza esencial de la mecánica cuántica.

Podemos describir el principio de completitud como sigue: si por medio de cierta medida podemos predecir con certidumbre el valor de una cierta magnitud Q, y si por medio de otra medida alternativa y diferente podemos estimar con certeza el valor de la magnitud R, entonces, de acuerdo con la noción de completitud, debería ser posible asignar valores simultáneos exactos a ambas magnitudes Q y R. Einstein y sus colegas aplicaron el principio a dos cantidades que en mecánica cuántica no pueden medirse simultáneamente con precisión, a saber, el momento y la posición de un mismo objeto. Se establecía así una contradicción entre la mecánica cuántica y el principio de completitud. ¿Cuál es la relación real, dentro del marco de la mecánica cuántica, entre una medida que permite establecer el valor exacto de la posición de una partícula en un instante determinado y otra medida que permite obtener el valor del momento en el mismo instante? Esas medidas tienen lugar en dos ramas diferentes, decoherentes entre sí (como una rama histórica en la que un caballo gana la carrera y otra en la que gana un caballo distinto). La exigencia de Einstein equivale a aceptar que los resultados de dos ramas alternativas deben aceptarse simultáneamente. Y eso implica claramente abandonar la mecánica cuántica.

Las variables ocultas

Einstein quería en realidad reemplazar la mecánica cuántica por un marco teórico diferente. En comentarios hechos aquí y allá, manifestó su creencia en que el éxito de la mecánica cuántica tenía sus raíces en resultados teóricos que sólo aproximadamente eran correctos, y que representaban una especie de promedio estadístico sobre las predicciones de otra clase de teoría.

Esta concepción einsteniana asumió una forma más definida cuando diversos teóricos, en diferentes momentos, sugirieron que había que sustituir la mecánica cuántica por una teoría clásica y determinista —pero en la que hay presente un gran número de «variables ocultas»—. Estas variables pueden imaginarse como si describiesen un enjambre de moscas invisibles zumbando por todas partes en el universo más o menos al azar, interactuando con las partículas elementales y afectando su comportamiento. Puesto que estas moscas son indetectables, lo mejor que puede hacer un físico teórico a la hora de realizar predicciones es tomar un promedio estadístico sobre sus movimientos. Pero estas moscas invisibles generan fluctuaciones imprevisibles, creando así indeterminaciones. La esperanza era que estas indeterminaciones encajasen de alguna manera con las de la mecánica cuántica, de modo que las predicciones del nuevo esquema concordaran con las predicciones mecanocuánticas en todos los casos en que la experiencia confirmaba éstas últimas.

Bohm y Einstein

Conocí a un físico teórico que estuvo vacilando, al menos por un tiempo, entre la aceptación de la mecánica cuántica y la idea de que podría ser sustituida por alguna teoría de «variables ocultas». Era David Bohm, quien durante toda su carrera profesional se preocupó de comprender el significado de la mecánica cuántica.

En 1953, cuando acababa de doctorarse y era un estudiante postdoctoral en el Instituto de Estudios Avanzados, David trabajaba como profesor asistente en la Universidad de Princeton. Los dos estábamos solteros y a veces pasábamos la tarde paseando por los alrededores de Princeton, discutiendo de física. David me confesó que, como marxista que era, le costaba aceptar la mecánica cuántica (el marxismo tiende a preferir teorías completamente deterministas). Dado que la mecánica cuántica tenía un éxito arrollador, no contradicho por ninguna experiencia, había intentado convencerse a sí mismo de que esta teoría era, después de todo, filosóficamente aceptable. En su intento de reconciliar la mecánica cuántica con sus convicciones marxistas, había escrito un manual elemental sobre teoría cuántica, poniendo especial énfasis en su interpretación. El libro estaba a punto de publicarse, y David estaba ansioso por mostrar a Einstein los capítulos más relevantes y ver si podía así vencer las objeciones de aquel gran hombre. Me pidió que le concertase una cita. Le respondí que yo no era la persona más indicada, pues apenas le conocía, pero que hablaría con la señorita Dukas, la formidable secretaria de Einstein, para ver qué se podía hacer.

Cuando me encontré a David uno o dos días más tarde y me disponía a decirle que estaba preparando su cita, me interrumpió entusiasmado para anunciarme que ya no era necesaria. Su libro había salido a la venta y Einstein ya lo había leído y le había telefoneado para decirle que la suya era la mejor presentación del caso en su contra que jamás había visto, y que estaría encantado de encontrarse con él para discutirla. Naturalmente, cuando vi a David al día siguiente, me moría por saber cómo se había desarrollado la conversación, y así se lo pregunté. David me miró un tanto avergonzado y me dijo: «Me ha disuadido de todo. Estoy de nuevo donde estaba antes de escribir el libro». Desde entonces, y durante más de cuarenta años, David intentó reformular y reinterpretar la mecánica cuántica para superar sus dudas. Hace muy poco me enteré, con gran pesar, de que había muerto.

El experimento EPRB

Hace muchos años, David Bohm propuso sustituir el hipotético experimento de «completitud» de Einstein, Podolsky y Rosen (que no hace falta describir aquí) por una versión modificada, más práctica. El experimento de Bohm (llamado EPRB en honor a los cuatro físicos) implica la desintegración de una partícula en dos fotones. Si la partícula está inicialmente en reposo y no tiene «espín» intrínseco, los dos fotones producidos viajan en direcciones opuestas, poseen la misma masa y tienen idéntica polarización. Si uno de los fotones tiene una polarización circular levógira (es decir, «gira» hacia la izquierda), el otro está en el mismo estado, y lo mismo ocurre con la polarización dextrógira. Si uno está polarizado linealmente (es decir, su campo eléctrico oscila según un cierto eje) entonces también lo está el otro.

Se asume que todo está dispuesto de manera que nada perturba a los fotones hasta que penetran en un detector. Si se mide la polarización circular de uno de los fotones, se conoce también la polarización del otro —es la misma—. Análogamente, si se mide el plano de polarización de un fotón, se conoce igualmente el del otro —de nuevo el mismo—. La condición de completitud de Einstein implicaría que se puede asociar un valor definido a la polarización plana o circular del segundo fotón. Pero no se puede determinar simultáneamente la polarización plana y la polarización circular de un fotón (no más que la posición y el momento de una partícula). En consecuencia, el requerimiento de completitud tampoco es razonable en este caso desde el punto de vista de la mecánica cuántica. Las dos medidas, una de la polarización plana y otra de la circular, son alternativas; tienen lugar en ramas diferentes de la historia y no hay razón para considerar los resultados de ambas a la vez.

EPRB y la alternativa de las variables ocultas

Más tarde, los trabajos de John Bell demostraron que el experimento EPRB podía emplearse para distinguir la mecánica cuántica de las hipotéticas teorías de variables ocultas, a través de ciertas medidas de la polarización de ambos fotones. El teorema de Bell (también conocido como desigualdades de Bell) se refiere a una magnitud particular que especifica la correlación entre las polarizaciones de ambos fotones. En mecánica cuántica, esta cantidad puede tomar valores no permitidos en una teoría clásica de variables ocultas.

Tras la publicación de la obra de Bell, varios equipos de físicos experimentales realizaron el experimento EPRB. Los resultados fueron esperados con ansiedad, pese a que virtualmente todos los físicos apostaban por la corrección de la mecánica cuántica; las experiencias acabaron dándoles la razón. Uno podría haber esperado que la gente de todo el mundo interesada en el tema soltase un suspiro de alivio al oír las noticias, para luego seguir con su vida normal. En vez de eso, empezó a propagarse una ola de artículos alegando que la mecánica cuántica había demostrado tener propiedades fantásticas e inquietantes. Por supuesto, se trataba de la misma mecánica cuántica de siempre. No había nada nuevo, salvo su confirmación y la subsiguiente verborrea desbordada.

La historia distorsionada

La principal distorsión diseminada por los medios de comunicación y por varios libros fue la implicación, incluso la afirmación taxativa, de que el medir la polarización, plana o circular, de uno de los fotones afectaba de alguna manera al otro fotón. En realidad, la medida no causa la propagación de ningún efecto físico de un fotón al otro. ¿Qué es lo que ocurre entonces? Si, sobre una particular rama de la historia, se mide la polarización plana de uno de los fotones y se especifica así con certeza, entonces, sobre la misma rama de la historia, la polarización plana del otro fotón queda igualmente especificada con total certidumbre. En una rama diferente de la historia puede especificarse la polarización circular de uno de los fotones, en cuyo caso queda especificada con certeza la polarización circular de ambos fotones. En cada rama la situación es similar a la de los calcetines de Bertlmann, descrita por John Bell en uno de sus artículos. Bertlmann es un matemático que siempre lleva un calcetín de color rosa y otro de color verde. Si se le mira un pie y se ve un calcetín verde, se sabe inmediatamente que en el otro pie lleva uno rosa. Y, sin embargo, no se ha propagado ninguna señal de un pie al otro. Tampoco viaja ninguna señal de un fotón a otro en el experimento que confirma la mecánica cuántica. No se produce ninguna acción a distancia.

La falsa afirmación de que la medida de uno de los fotones afecta instantáneamente al otro conduce a toda clase de conclusiones desafortunadas. En primer lugar, el efecto alegado, al ser instantáneo, viola el requerimiento de la teoría de la relatividad de que ninguna señal —ningún efecto físico— puede viajar a una velocidad mayor que la de la luz. Si una señal pudiese viajar a una velocidad superior, habría observadores en determinados estados de movimiento que la verían propagándose hacia atrás en el tiempo. De aquí el ripio:

Había una señorita llamada Resplandor
Que podía viajar más deprisa que la luz.
Un día partió por una ruta relativa,
Y regresó a casa la noche anterior

Después, ciertos escritores han afirmado que la mecánica cuántica podría dar cabida a fenómenos «paranormales» como la precognición, en que se supone que individuos «psíquicos» pueden conocer de antemano el resultado de procesos aleatorios. Es innecesario decir que estos supuestos fenómenos resultan tan molestos para la mecánica cuántica como para la física clásica; si resultaran ser verdaderos, su explicación requeriría una total reformulación de las leyes de la naturaleza tal como las conocemos ahora.

Otro producto de la verborrea es la presentación de propuestas, dirigidas por ejemplo al Departamento de Defensa de los Estados Unidos, para aplicar la mecánica cuántica al diseño de sistemas de comunicación militares más rápidos que la luz. Uno se pregunta si el advenimiento de esta nueva categoría de proyectos estrafalarios no representará el declive de otros más antiguos, como la antigravedad o el movimiento perpetuo. Si no es así, la burocracia que se encarga de ellos deberá emplear más personal.

Aplicaciones potenciales serias del efecto EPRB

Mientras tanto, investigadores serios han comenzado a pensar en las posibles aplicaciones del efecto EPRB. En lugar de ideas estrafalarias, se están considerando aplicaciones potenciales fascinantes. Por ejemplo, Charlie Bennett, Gilíes Brassard y Arthur Ekert han estado desarrollando una forma de criptografía cuántica en la que el efecto EPRB se emplea reiteradamente para generar una cadena aleatoria de bits conocida por dos personas y por nadie más. Esta cadena se puede usar como base de un cifrado impenetrable para transmitirse mensajes secretos entre ambas.

El método funciona más o menos de la siguiente forma. Supongamos que Alice y Bob disponen de un suministro estable de pares de fotones EPRB. De cada par, un fotón llega a Alice y otro a Bob.

Previamente acuerdan hacer una larga serie de medidas de la polarización plana de sus fotones respectivos, distinguiendo la mitad de las veces entre dos direcciones perpendiculares, llamadas x e y, y la otra mitad entre otras dos direcciones perpendiculares (en medio de x e y), llamadas X e Y. (Los ejes X e Y se obtienen girando 45° los ejes x e y, como muestra la ilustración de la Figura 11). Para cada uno de sus fotones, Alice elige al azar si medirá su polarización respecto a los ejes x e y o respecto a los ejes X e Y. Bob por su parte hace lo mismo.

011.jpg
Figura 11. Ejes de polarización usados en criptografía cuántica

Una vez han terminado, Alice comunica a Bob la clase de medidas que ha hecho en cada uno de sus fotones, x e y o X e Y, y Bob da a Alice la misma información (la conversación puede hacerse en un teléfono público intervenido por espías sin ningún problema). De esta manera averiguan cuándo hicieron ambos el mismo tipo de medida (lo que habrá sucedido más o menos la mitad de las veces). Para cada medida común, los resultados obtenidos por Alice y Bob deben ser idénticos, a causa del efecto EPRB. Los resultados de esas medidas comunes son conocidos por ambos y por ninguna otra persona (asumiendo que cada uno hizo las medidas en secreto y que no divulgó nada). Estos resultados se pueden representar por una cadena de unos (correspondiente a x o X) y de ceros (correspondiente a y o Y), conocida sólo por Alice y Bob. Esta cadena puede servir como base de un código secreto indescifrable que pueden usar entre ellos.

Si Alice y Bob están especialmente preocupados por la seguridad, pueden emplear los resultados de algunas de las medidas comunes para comprobar, a través de una línea telefónica abierta, que los unos y ceros correspondientes son ciertamente idénticos (dejando el resto de la cadena para sus mensajes secretos). Un espía que de alguna manera hubiese realizado sus propias medidas sobre los fotones habría destruido la perfecta concordancia entre los resultados de Alice y Bob. La comparación entre algunas de las medidas revelaría la presencia del espía.

En realidad la criptografía cuántica no requiere el efecto EPRB. Por ello, un grupo de seis físicos (entre ellos el propio Bennett) ha inventado un ingenioso procedimiento, en el que el efecto EPRB es esencial, consistente en destruir un fotón y crear otro en el mismo estado de polarización pero en otra parte (es decir, con una distribución de probabilidad en el espacio diferente).

A medida que hemos ido sabiendo más cosas sobre las partículas elementales, se ha puesto de manifiesto la notable interrelación entre la aparente complejidad revelada por los experimentos y la simplificación lograda por la teoría. El descubrimiento de gran número de partículas diferentes y de las diversas interacciones entre ellas ha reforzado la impresión de que la física de partículas es complicada. Al mismo tiempo, desde la perspectiva teórica, los progresos en la unificación de la descripción de las partículas y sus interacciones han mostrado su simplicidad subyacente. Aunque la física de las partículas elementales tiene menos de un siglo de edad, quizá hayamos alcanzado ya una fase en que su unidad haya comenzado a revelarse en la forma de un principio único, del cual se espera que pueda predecir la existencia de la diversidad de partículas elementales observadas.

Capítulo 13
Quarks y todo lo demás: El modelo estándar

Toda teoría respetable sobre las partículas elementales se desarrolla dentro del marco de la teoría cuántica de campos, que incluye tanto el modelo estándar como la teoría de supercuerdas. La teoría cuántica de campos está basada en tres supuestos fundamentales: la validez de la mecánica cuántica, la validez del principio de relatividad de Einstein (la relatividad especial cuando no se incluye la gravedad, y la relatividad general en caso contrario) y la localidad (es decir, todas las fuerzas fundamentales surgen de procesos locales y no de la acción a distancia). Esos procesos locales incluyen la emisión y absorción de partículas.

Electrodinámica cuántica (QED)

El primer ejemplo satisfactorio de una teoría cuántica de campos fue la electrodinámica cuántica (también conocida por las siglas QED, del inglés quantum electrodynamics), la teoría del electrón y el fotón. El electrón es un fermión (esto es, obedece el principio de exclusión de Pauli) y posee una unidad fundamental de carga eléctrica (denominada «negativa», según un criterio que data de Benjamín Franklin). El fotón es un bosón (en otras palabras, obedece el principio de antiexclusión) y es eléctricamente neutro.

En el marco de la electrodinámica cuántica, la fuerza electromagnética entre dos electrones surge de la emisión de un fotón por una de las partículas y su absorción por la otra. Si uno sabe algo de física clásica, puede objetar que un electrón que emita un fotón (es decir, que se transforme en un electrón más un fotón) viola el principio de conservación de la energía, el de conservación del momento, o ambos a la vez; lo mismo ocurre con la absorción del fotón. Pero si uno conoce un poco de física cuántica, probablemente sabrá que la conservación de la energía no rige en intervalos finitos de tiempo, sino sólo a largo plazo. Esta propiedad de la mecánica cuántica es una manifestación del principio de incertidumbre de Heisenberg aplicado a la energía y el tiempo. El sistema puede tomar prestado por un momento un poco de energía para permitir que el primer electrón emita un fotón, energía que será devuelta cuando el otro electrón lo absorba. Este proceso se conoce como intercambio «virtual» de un fotón entre dos electrones. El fotón es emitido y absorbido sólo en el sentido peculiar de la mecánica cuántica.

En cualquier teoría cuántica de campos se pueden trazar unos graciosos dibujos, inventados por mi antiguo colega Dick Feynman, que nos dan una idea ilusoria de lo que pasa. En el de la Figura 12, dos electrones intercambian un fotón virtual que mediatiza la interacción electromagnética entre ellos. Cada electrón se indica por una «e» con un signo menos que indica una unidad de carga eléctrica negativa. El fotón lleva un cero como superíndice, lo que indica que es eléctricamente neutro. Una «e» con un signo más representaría el positrón, la antipartícula del electrón. Pero ¿qué es una antipartícula?

012.jpg
Figura 12. Dos electrones intercambian un fotón virtual, lo que da lugar a la tuerca electromagnética entre ellos

La simetría partícula-antipartícula

La teoría cuántica de campos implica una simetría fundamental entre las partículas elementales y sus «antipartículas». Para cada partícula hay una antipartícula correspondiente, que se comporta como una partícula moviéndose hacia atrás en el espacio y en el tiempo. La antipartícula de la antipartícula es la propia partícula. Si dos partículas son cada una antipartícula de la otra, entonces poseen cargas eléctricas opuestas (cargas de la misma magnitud pero de signo contrario) y la misma masa. La antipartícula del electrón recibe el nombre de positrón por su carga positiva. Algunas partículas eléctricamente neutras, como el fotón, son sus propias antipartículas.

Cuando Dirac publicó su ecuación relativista para el electrón en 1928, abrió las puertas para el desarrollo posterior de la electrodinámica cuántica. La interpretación de la ecuación de Dirac apuntaba la necesidad de la existencia del positrón, pero inicialmente Dirac no la predijo. En vez de eso, señaló que aquel esperado objeto de carga positiva debía identificarse de alguna manera con el protón, bien conocido experimentalmente, aunque dos mil veces más pesado que el electrón (del cual se diferencia también en otros aspectos fundamentales). Décadas después, cuando pregunté a Dirac por qué no había predicho inmediatamente el positrón, me replicó con su habitual tono lacónico: «Pura cobardía». El descubrimiento se dejó en manos de los experimentadores. El positrón se reveló en 1932 en los laboratorios de mi antiguo colega Carl Anderson, en Caltech, y de Patrick Blackett, en Inglaterra. Ambos compartieron el Premio Nobel de Física pocos años después. Sus experimentos establecieron que la simetría partícula-antipartícula propia de la teoría cuántica de campos es un fenómeno real.

El modelo estándar puede considerarse en gran medida como una generalización de la electrodinámica cuántica. El electrón y el positrón se suplementan con otros muchos pares fermiónicos partícula-antipartícula, y los fotones con otros cuantos. Así como el fotón es el cuanto o portador de la fuerza electromagnética, los otros cuantos son los mediadores de otras fuerzas fundamentales.

Quarks

Durante mucho tiempo se pensó que los compañeros del electrón en la lista de fermiones fundamentales serían únicamente el protón y el neutrón, los constituyentes del núcleo atómico. Pero esto resultó ser falso: el neutrón y el protón no son elementales. También en otras ocasiones los físicos han descubierto que objetos que originalmente se creían fundamentales estaban compuestos de partes más simples. Las moléculas están formadas por átomos. Los átomos, pese a que su nombre procede de la palabra griega que significa «indivisible», están formados por un núcleo con electrones en torno a él. Los núcleos están compuestos a su vez por protones y neutrones, como se comenzó a vislumbrar en 1932 con el descubrimiento del neutrón. Ahora sabemos que protones y neutrones son también entidades compuestas: están formados por quarks. Los teóricos están ahora seguros de que los quarks son los análogos de los electrones. (Si los quarks resultan estar compuestos por entidades menores, cosa que hoy parece poco probable, entonces el electrón también tendría que estarlo.)

En 1963, cuando bauticé con el nombre de «quark» a los constituyentes elementales de los nucleones, partí de un sonido que no se escribía de esa forma, algo parecido a «cuorc». Entonces, en una de mis lecturas ocasionales de Finnegans Wake, de James Joyce, descubrí la palabra «quark» en la frase «Tres quarks para Muster Mark». Dado que «quark» (que se aplica más que nada al grito de una gaviota) estaba para rimar con «Mark», tenía que buscar alguna excusa para pronunciarlo como «cuorc». Pero el libro narra los sueños de un tabernero llamado Humphrey Chipmden Earwicker. Las palabras del texto suelen proceder simultáneamente de varias fuentes, como las «palabras híbridas» en A través del espejo, de Lewis Carroll. De vez en cuando aparecen frases parcialmente determinadas por la jerga de los bares. Razoné, por tanto, que tal vez una de las fuentes de la expresión «Tres quarks para Muster Mark» podría ser «Tres cuartos para Mister Mark» (cuarto en inglés es quart) en cuyo caso la pronunciación «cuorc» no estaría totalmente injustificada. En cualquier caso, el número tres encajaba perfectamente con el número de quarks presentes en la naturaleza.

La receta para elaborar un neutrón o un protón a partir de quarks es, más o menos, «mezclar tres quarks». El protón está compuesto de dos quarks u [de up, «arriba»] y un quark d [de down, «abajo»], mientras que el neutrón lo componen dos quarks d y un quark u. Los quarks u y d poseen diferente carga eléctrica. En las mismas unidades en que el electrón tiene carga -1, el protón tiene carga +1 y el neutrón carga nula. En estas mismas unidades, el quark u tiene carga 2/3 y el quark d -1/3. Si sumamos 2/3, 2/3 y -1/3, obtenemos la carga del protón, +1; y si sumamos -1/3, -1/3 y 2/3, obtenemos 0, la carga del neutrón.

Se dice que u y d son diferentes «sabores» de quark. Además del sabor, los quarks tienen otra propiedad aún más importante llamada «color», aunque no tiene que ver con los colores reales más que el sabor en este contexto con el sabor de un helado. Aunque el término «color» es más que nada un nombre gracioso, sirve también como metáfora. Hay tres colores, denominados rojo, verde y azul a semejanza de los tres colores básicos en una teoría simple de la visión humana del color (en el caso de la pintura, los tres colores primarios suelen ser el rojo, el amarillo y el azul, pero para mezclar luces en vez de pigmentos, el amarillo se sustituye por el verde). La receta para un neutrón o un protón consiste en tomar un quark de cada color, es decir, uno rojo, uno verde y uno azul, de modo que la suma de colores se anule. Como en la visión el color blanco se puede considerar una mezcla de rojo, verde y azul, podemos decir metafóricamente que el neutrón y el protón son blancos.

Quarks confinados

Los quarks poseen la notable propiedad de estar permanentemente atrapados dentro de partículas «blancas» como el protón y el neutrón. Sólo las partículas blancas son directamente observables en el laboratorio. En éstas el color se promedia y cancela, y sólo en su interior pueden existir objetos coloreados. De la misma forma, la carga eléctrica de un objeto observable es siempre un número entero (como 0, 1, -1 o 2), y las partículas con carga fraccionaria sólo pueden existir en su interior.

Cuando propuse la existencia de los quarks, creía desde el principio que estarían permanentemente confinados de alguna manera. Me refería a ellos como entes «matemáticos», explicando cuidadosamente qué quería decir con eso y contrastándolo con lo que yo llamaba «quarks reales», susceptibles de emerger y ser detectados como entidades singulares. La razón para esta elección de lenguaje era que no tenía ganas de entablar discusiones con críticos de inclinación filosófica que me exigiesen explicar cómo podía calificar de «reales» a los quarks si siempre estaban ocultos. La terminología se demostró, no obstante, desafortunada. Muchos autores, ignorando mi explicación de los términos «matemático» y «real», así como el hecho de que la situación que yo describía es la que actualmente se considera correcta, han afirmado que yo en realidad no creía en la presencia física de los quarks. Una vez que un malentendido como éste queda establecido en la literatura popular tiende a perpetuarse, porque los escritores muchas veces se limitan a copiarse entre sí.

Gluones coloreados

Para que los quarks permanezcan confinados, deben existir fuerzas entre ellos muy diferentes de las electromagnéticas u otras fuerzas familiares. ¿De dónde surge esta diferencia?

Así como la fuerza electromagnética entre electrones está mediatizada por el intercambio virtual de fotones, los quarks están ligados entre sí por una fuerza que surge del intercambio de otros cuantos: los gluones (del inglés glue, pegar), llamados así porque hacen que los quarks se peguen formando objetos observables blancos como el protón y el neutrón. Los gluones son indiferentes al sabor —podríamos decir que no tienen sentido del gusto—. En cambio, son muy sensibles al color. De hecho, el color juega el mismo papel para ellos que la carga eléctrica para los fotones: los gluones interaccionan con el color de modo muy parecido a como el fotón interacciona con la carga eléctrica.

La triple naturaleza del color requiere de los gluones una propiedad que no comparten con el fotón: existen diferentes gluones para las diferentes interacciones de color. En los diagramas de la Figura 13 se muestra a la izquierda un quark rojo que se convierte en azul emitiendo un gluón virtual rojo-azul, el cual es absorbido por un quark azul que se convierte a su vez en rojo. El diagrama de la derecha muestra otra situación en la que un quark azul se convierte en uno verde, emitiendo un gluón virtual azul-verde que es absorbido por un quark verde, el cual se transforma en un quark azul. (A propósito, nótese que la antipartícula de un gluón es también un gluón; por ejemplo, los gluones azul-verde y verde-azul son cada uno la antipartícula del otro.) Los sabores se han elegido diferentes en uno y otro diagrama para ilustrar el carácter irrelevante del sabor en los procesos de color mediatizados por gluones.

013.jpg
Figura 13. Fuerzas entre quarks a partir del intercambio de gluones virtuales

Cromodinámica cuántica

Hacia 1972, algunos de nosotros contribuimos a la formulación de una teoría cuántica de campos definida para quarks y gluones. La denominé cromodinámica cuántica, empleando la raíz griega chromos (color). Parece que es la teoría correcta y como tal se la reconoce por lo general, aunque todavía queda mucho trabajo matemático por hacer antes de que podamos asegurar que sus detalladas predicciones cuantitativas están de acuerdo con la experiencia, confirmándose así que los quarks, antiquarks y gluones (los componentes de todos los objetos nucleares, como el neutrón y el protón) se comportan realmente según las leyes de la cromodinámica cuántica.

Para comparar la electrodinámica cuántica (QED) con la cromodinámica cuántica (QCD, del inglés quantum chromodynamics) podemos elaborar una especie de diccionario como el que se muestra en la Figura 14. En la QED, electrones y positrones interactúan a través del intercambio de fotones virtuales, mientras que en la QCD quarks y antiquarks lo hacen intercambiando gluones virtuales. La fuerza electromagnética surge de las cargas eléctricas; podemos pensar que la fuerza de color surge de cargas de color. Tanto la carga eléctrica como la de color son magnitudes perfectamente conservadas —la carga de color, como la carga eléctrica, no puede crearse ni destruirse.

No obstante, existe una diferencia crucial entre ambas teorías: en la QED, el fotón, mediador de la interacción electromagnética, es eléctricamente neutro, mientras que en la QCD los gluones, que mediatizan la fuerza de color, están a su vez coloreados. Esto hace que interactúen entre sí de una manera imposible para los fotones, lo que da como resultado la aparición de términos en las ecuaciones de la QCD que no tienen análogo en la QED. La fuerza de color se comporta de manera muy distinta a la electromagnética o cualquier otra fuerza antes conocida: no se desvanece a largas distancias. Esta propiedad explica por qué quarks, antiquarks y gluones coloreados se encuentran permanentemente confinados en el interior de objetos blancos como el neutrón y el protón. La fuerza de color actúa como una especie de resorte que los mantiene unidos.

Pese a que los quarks están eternamente confinados y no pueden detectarse directamente en el laboratorio, se han realizado elegantes experimentos que han confirmado su existencia. Por ejemplo, se puede usar un haz de electrones energéticos para hacer una especie de micrografía electrónica del interior del protón; se ha revelado así la estructura de quarks que esconde. Me sentí encantado cuando mis colegas Dick Taylor, Henry Kendall y Jerry Friedman compartieron el Premio Nobel de Física por este experimento. (Me hubiese gustado haberme dado cuenta antes de que éste era un buen método para confirmar la existencia de los quarks.)

La simplicidad revelada por la QCD

Dentro del núcleo atómico, neutrones y protones se encuentran ligados (a diferencia de los quarks, no están confinados y pueden extraerse individualmente). Ahora que se sabe que estas partículas están compuestas por quarks, ¿cómo se describen las fuerzas nucleares entre ellas? Cuando era estudiante graduado, uno de los grandes misterios que esperábamos resolver algún día era el carácter de esas fuerzas. La mayoría de teóricos piensa hoy día que la QCD proporciona la solución del problema, aunque ni de lejos están resueltos todos los cálculos relevantes. La situación es análoga a la de las fuerzas entre átomos o moléculas, explicadas a finales de los años veinte tras el descubrimiento de la mecánica cuántica. Tales fuerzas no son en absoluto fundamentales, sino una consecuencia indirecta del tratamiento cuántico de la fuerza electromagnética. Análogamente, la fuerza nuclear no es fundamental, sino que surge como efecto secundario de la fuerza de color, que a su vez procede de la interacción entre quarks y gluones.

014.jpg
Figura 14. Comparación entre la QED y la QCD. Los quarks y antiquarks se asocian con el fotón a través de su carga eléctrica, pero el electrón y el positrón no se asocian con los gluones

El protón y el neutrón no son las únicas partículas blancas observables, aunque sí las más conocidas. Cientos de partículas nucleares diferentes han sido descubiertas desde finales de los años cuarenta en colisiones de alta energía, primero en los experimentos con rayos cósmicos y más tarde en los aceleradores de partículas. Todas ellas han sido explicadas como combinaciones de quarks, antiquarks y gluones. El esquema de los quarks, incorporado dentro de una teoría dinámica explícita como la cromodinámica cuántica, ha revelado la simplicidad subyacente en el aparentemente complicado cuadro de partículas. Por otra parte, todas estas partículas interaccionan entre sí a través de la «interacción fuerte», que incluye la fuerza nuclear. Se piensa que las muchas manifestaciones de la interacción fuerte se pueden describir como consecuencia indirecta de la interacción fundamental quark-gluón. La cromodinámica cuántica ha revelado la simplicidad de la interacción fuerte, así como la simplicidad de las partículas nucleares que son los actores de dicha interacción.

Electrón y neutrino electrónico: La fuerza débil

Las partículas nucleares y sus constituyentes fundamentales no son lo único importante. El electrón, por ejemplo, no posee color y no percibe la fuerza de color ni la fuerza nuclear resultante. De hecho, en un átomo pesado los electrones interiores pasan la mayor parte del tiempo dentro del núcleo sin reaccionar a la fuerza nuclear, aunque naturalmente sí son susceptibles a efectos electromagnéticos tales como la atracción eléctrica de los protones.

Pese a que el electrón no tiene color, posee sabor. Así como el quark d tiene al quark u como compañero de color, el electrón tiene por compañero al neutrino electrónico. El neutrino electrónico es una especie de compañero silencioso porque, al ser eléctricamente neutro, ignora no sólo la fuerza nuclear (lo mismo que el electrón), sino también la fuerza electromagnética. Es muy probable, por ejemplo, que atraviese la Tierra sin interaccionar con partícula alguna. Los neutrinos producidos en las reacciones termonucleares que tienen lugar en el interior del Sol llueven sobre nosotros durante el día, pero también nos alcanzan durante la noche atravesando todo el planeta. Cuando el escritor John Updike conoció este aspecto del comportamiento de los neutrinos, compuso el siguiente poema, titulado «Descaro cósmico»:

Los neutrinos son muy pequeños.
No tienen carga ni masa
Y no interaccionan en absoluto.
La Tierra es sólo una tonta pelota
Para ellos, que la atraviesan como si nada.
Como una doncella por un salón impoluto,
O como fotones por una lámina de cristal,
Desprecian el gas más exquisito,
Ignoran la pared más sustancial.
Hombros de acero, latón resonante,
Insultan al semental en su establo,
Y, burlándose de las barreras entre clases,
¡Se infiltran en ti y en mí!
Como altas E indoloras guillotinas, caen
Sobre nuestras cabezas en la hierba.
Por la noche, entran en Nepal
Y traspasan al amante y a su amada Desde debajo de la cama
—dices que es Maravilloso, yo digo que es craso.

(Resulta tentador permitirse una licencia científica y sustituir en la tercera línea «no» por «apenas».)

Desafortunadamente, la detección de neutrinos solares está plagada de dificultades. El porcentaje de detecciones parece ser menor que el predicho, lo que induce a los físicos a proponer explicaciones con diversos grados de plausibilidad. Mi colega Willy Fowler llegó a sugerir que tal vez el horno nuclear del interior del Sol se apagó hace tiempo, pero que los mecanismos de transferencia de energía en el Sol son tan lentos que la mala nueva todavía no ha alcanzado la superficie. Poca gente cree que sea ésta la explicación correcta, pero si es así, ciertamente nos espera una auténtica crisis energética.

¿Cómo se producen los neutrinos en el interior del Sol y cómo pueden detectarse en los laboratorios aquí en la Tierra, si no están sujetos ni a la fuerza nuclear fuerte ni a la electromagnética?

La responsable es la denominada fuerza débil. El neutrino electrónico participa en esta interacción, junto con el electrón. De aquí la revisión sugerida de la frase de John Updike «no interaccionan en absoluto».

La interacción débil produce reacciones como las siguientes:

  1. Un electrón se transforma en un neutrino electrónico, mientras que un protón se convierte en un neutrón. Esta reacción es un ejemplo de producción de neutrinos; el protón involucrado forma parte de un núcleo pesado y el electrón es uno de los más internos que orbitan alrededor de ese núcleo, dentro del cual pasa una parte apreciable del tiempo.
  2. El proceso inverso, en el cual un neutrino electrónico se transforma en un electrón, mientras que un neutrón se convierte en un protón. Esta reacción ilustra un mecanismo de detección de neutrinos, en el que el neutrón está situado dentro de un núcleo.

015.jpg
Figura 15. Un electrón se transforma en un neutrino electrónico a la vez que un quaric u se convierte en un quaric d. Dos versiones del mismo diagrama de Feynman

No obstante, dado que ni el neutrón ni el protón son elementales, estas reacciones no son procesos básicos. Los auténticos procesos básicos, en los que intervienen quarks, son:

  1. Un electrón se transforma en un neutrino electrónico mientras que un quark u se convierte en un quark d.
  2. Un neutrino electrónico se convierte en un electrón, al tiempo que un quark d pasa a ser un quark u.

Estas reacciones implican un cambio de sabor, tanto por parte del electrón que se transforma en neutrino electrónico (o viceversa) como del quark u que se convierte en quark d (o viceversa). Como en cualquier proceso descrito por una teoría cuántica de campos, se produce el intercambio de un cuanto. Para cada una de estas reacciones (la primera de las cuales está ilustrada en la Figura 15) hay dos versiones posibles del mismo diagrama de Feynman, una en la que se intercambia un cuanto cargado positivamente y otra en la que se intercambia un cuanto de carga negativa. La existencia de estos cuantos fue propuesta por algunos de nosotros a finales de los cincuenta, y veinticinco años después fueron descubiertos en el CERN, en los experimentos que proporcionaron el Premio Nobel a Carlo Rubbia y Simon Van de Meer. Suelen denotarse por W y W, como fueron designados por T. D. Lee y C. N. Yang en un célebre artículo, aunque a menudo se les denota por XX y X-, como acostumbramos Dick Feynman y yo.

016.jpg
Figura 16. Dispersión de un neutrino electrónico en un quaric d

Dinámica cuántica del sabor y corrientes neutras

Tanto el electromagnetismo como las interacciones débiles pueden considerarse fuerzas de sabor, dado que la carga eléctrica varía con el sabor y las fuerzas débiles tienen que ver con cambios de sabor. Durante los años cincuenta y sesenta se formuló una especie de dinámica cuántica del sabor, que incorporaba el electromagnetismo y una teoría de las interacciones débiles. La dinámica cuántica del sabor (asociada especialmente con los nombres de Sheldon Glashow, Steven Weinberg y Abdus Salam) predijo, entre otras cosas, la existencia de una nueva fuerza de sabor que causa la dispersión de los neutrinos electrónicos por parte de protones o neutrones, sin ningún cambio de sabor.

En términos de quarks, esta nueva fuerza causa la dispersión de los neutrinos electrónicos frente a quarks u y d, de nuevo sin cambio de sabor La dispersión tiene lugar a través del intercambio de un nuevo cuanto eléctricamente neutro, denotado por ZZ como se ilustra en la página anterior. La existencia de este cuanto fue confirmada de nuevo por Rubbia, Van der Meer y sus colegas.

Familias de fermiones

El diagrama de la Figura 17 resume todo lo dicho sobre partículas y fuerzas. Existe una familia fermiónica compuesta por el electrón y el neutrino electrónico y dos sabores de quarks con tres colores; la antifamilia correspondiente consta del positrón y el antineutrino electrónico y de dos sabores de antiquarks de tres colores. Asociados a la variable color (inexistente en el electrón y su neutrino, y en las antipartículas de éstos) encontramos los gluones de la cromodinámica cuántica. Asociados a la variable sabor, existente en toda la familia y en su antifamilia, están los cuatro cuantos de la dinámica cuántica del sabor.

Esta familia fermiónica no es única. Existen otras dos familias de estructura muy similar. Cada una consiste en una partícula similar al electrón, su correspondiente neutrino y dos sabores de quarks con cargas eléctricas -1/3 y 2/3, como los quarks u y d.

La partícula análoga al electrón de la segunda familia es el muón, descubierto en 1937 por Carl Anderson y Seth Neddermeyer en Caltech. Es una versión pesada del electrón, con una masa unas cien veces mayor, y posee su propio neutrino —el neutrino muónico—. Los quarks de esta segunda familia fermiónica son el s (de strange, «extraño», análogo al d) y el c (o charmed, «encantado», análogo al u). Como el muón, son más pesados que sus contrapartidas en la primera familia.

Se conoce también una tercera familia fermiónica, que incluye el leptón tau o tauón (veinte veces más pesado que el muón), el neutrino tauónico, el quark b (de bottom, «base»), con carga -1/3 y el quark t (de top, «techo»), de carga +2/3, detectado muy recientemente. Si los experimentadores no confirman la masa aproximada predicha para el quark t, los teóricos deberemos «clavarnos nuestras estilográficas», como solía decir mi antiguo colega Marvin «Murph» Goldberger. Menos mal que las estilográficas son raras hoy en día. Además, el antiguo héroe romano que quería suicidarse después de una derrota siempre tenía al lado un criado fiel para detener la espada —no está claro que una estilográfica pueda ser detenida con la suficiente firmeza por un estudiante.

017.jpg
Figura 17. Partículas elementales e interacciones presentadas hasta ahora. (Para más simplicidad se han omitido las antipartículas de los fermiones)

¿Es posible que haya más familias fermiónicas además de las tres conocidas? Recientes experimentos sobre la desintegración del cuanto ZZ han arrojado algo de luz sobre esta cuestión. Los resultados concordaban con las predicciones teóricas, que permitían la desintegración del ZZ en tres clases de pares neutrino-antineutrino correspondientes precisamente a los neutrinos electrónico, muónico y tauónico. No hay lugar para una cuarta clase de neutrino, a menos que, a diferencia de los otros tres, tenga una masa gigantesca. Una cuarta familia queda excluida, salvo que su neutrino sea muy diferente de los demás.

Con las tres familias de fermiones, sus antipartículas y los cuantos de las interacciones electromagnética, débil y gluónica, hemos llegado casi al final de nuestra descripción del modelo estándar, y todavía sigue siendo una extensión trivial de la QED. El fotón está acompañado por otros cuantos y el electrón por otros fermiones. El cuadro general de cuantos y fermiones, incluyendo sus masas y la intensidad de las fuerzas mediatizadas por los cuantos, muestra cierta complejidad aparente. Pero el modelo estándar no es todavía la teoría fundamental, y sólo en el nivel más fundamental puede revelarse la simplicidad de la teoría subyacente.

La aproximación de masa nula

Una manera de poner de manifiesto la simplicidad del modelo estándar es considerar la aproximación en que a todas las partículas hasta ahora mencionadas se les asigna masa nula, lo que implica que se mueven siempre a la velocidad de la luz y no pueden estar nunca en reposo. Cuando los cuantos de la fuerza débil se tratan como partículas sin masa, se hace manifiesta la similitud entre las tres interacciones. La dinámica cuántica del sabor y la cromodinámica cuántica tienen una estructura matemática semejante; ambas pertenecen a la misma clase de teorías: las llamadas teorías gauge o de Yang-Mills (como propusimos Shelly Glashow y yo hace años).

Cuando también se asigna masa nula a los fermiones, aparecen muchas simetrías. En particular, las tres familias fermiónicas comparten idénticas propiedades.

La cuestión que surge inmediatamente es cómo se rompe la aproximación de masa nula. Pero antes de describir el mecanismo que induce la existencia de masas no nulas, echemos un vistazo a las masas reales.

Masas (o energías) grandes y pequeñas

Cuando operamos con masas y energías, es esencial tener en cuenta la célebre relación de Einstein que establece que una partícula de masa en reposo no nula posee una energía igual a su masa por el cuadrado de c, donde c es la velocidad de la luz. Esta equivalencia entre masa en reposo y energía puede servir para asignar una energía equivalente a cualquier masa. Las masas del protón y el neutrón, una vez convertidas en energía, se acercan a un gigaelectronvoltio (GeV). El prefijo giga- indica mil millones; un GeV es la energía que tendría un electrón acelerado por una diferencia de potencial de mil millones de voltios. Ésta es una unidad conveniente para medir la energía equivalente a la masa de las partículas subatómicas.

Las masas no nulas de las partículas elementales del modelo estándar son en su mayoría muy distintas unas de otras. La masa del electrón es de unas cinco diezmilésimas de GeV. La masa del neutrino, caso de que posea, es del orden de una cienmillonésima de GeV. La masa del tauón es de unos 2 GeV. Los bosones X+ y Z0 tienen masas cercanas a 100 GeV. El quark t, el más pesado, tiene una masa estimada de unos 170 GeV. T odas estas masas violan la simetría propia de la aproximación de masa nula.

Violación espontánea de simetría

¿Cuál es el origen de estas masas no nulas, tan diferentes unas de otras? El mecanismo que opera en el modelo estándar ha sido comprendido al menos en parte. Tiene que ver con la existencia de una nueva clase (o varias) de bosón. Al menos uno de ellos podría ser observable dentro de la gama de energías disponibles en el nuevo acelerador del CERN. Es el llamado bosón de Higgs. Esta partícula no sólo fue considerada (en un elegante trabajo teórico) por Peter Higgs, de Edinburgh, sino también por otros físicos, entre ellos Tom Kibble, Gerald Guralnik y C. R. Hagen, y también Robert Brout y Francis Englert. Además, su existencia fue propuesta con anterioridad en términos generales por mi amigo Phillip Anderson, un físico teórico especialista en materia condensada y en la actualidad vicepresidente del comité científico del Instituto de Santa Fe. Obtuvo el Premio Nobel por sus trabajos en física de la materia condensada, pero su anticipación a la idea general de Higgs no ha sido nunca totalmente reconocida por la comunidad de físicos de partículas. No puedo evitar la sospecha de que si sus contribuciones hubiesen sido más ampliamente reconocidas nos habríamos ahorrado algunas de sus diatribas públicas en contra de la construcción de nuevos aceleradores. ¿Cómo puede oponerse a la construcción de una máquina destinada en parte a la búsqueda del bosón de Anderson- Higgs, o aunque sea el de Higgs-Anderson?

Para ser imparciales, sugiero que retengamos el término «bosón de Higgs», pero que empleemos la etiqueta «Anderson-Higgs» para el mecanismo que rompe la simetría de la aproximación de masa nula y es responsable de las diversas masas de las partículas en el modelo estándar. El mecanismo de Anderson-Higgs es un caso especial de un proceso más general, llamado ruptura espontánea de simetría.

Como ejemplo familiar de este proceso, podemos pensar en un imán ordinario, en el cual todos los minúsculos imanes elementales que lo componen están alineados. Las ecuaciones para las partículas elementales que constituyen el imán, en interacción mutua pero sin influencias externas, son perfectamente simétricas con respecto a las direcciones del espacio; por así decirlo, son indiferentes a la dirección en que apunta el imán. Pero cualquier perturbación externa, por tenue que sea (por ejemplo, un débil campo magnético exterior), puede determinar la orientación del imán, que en otro caso sería totalmente arbitraria.

Las ecuaciones para las partículas que componen el imán poseen simetría porque tratan todas las direcciones por igual, pero cada solución individual, al estar orientada en una dirección definida, viola la simetría. Ahora bien, el conjunto de todas estas soluciones asimétricas posee simetría, porque cada dirección se corresponde con una solución y el conjunto de todas las direcciones es perfectamente simétrico.

La esencia de la ruptura espontánea de simetría reside en esta misma circunstancia: las ecuaciones con una simetría particular pueden tener soluciones que violen individualmente esa simetría, aunque el conjunto de todas las soluciones sea simétrico.

La mayor virtud del mecanismo de Anderson-Higgs para la ruptura espontánea de simetría es que permite que los fermiones y los cuantos de la interacción débil adquieran masa no nula sin introducir desastrosos infinitos en los cálculos de la dinámica cuántica del sabor. Los teóricos de partículas buscaban hacía tiempo un mecanismo de este tipo para producir masas no nulas antes de que se demostrase que en el bosón de Higgs estaba la solución.

Violación de la simetría temporal

El mecanismo de Anderson-Higgs puede ser también el responsable de la pequeña desviación de la simetría de inversión temporal observada en la física de partículas elementales. Las ecuaciones de la teoría fundamental subyacente deberían ser entonces simétricas frente a la inversión temporal (de hecho, la teoría de supercuerdas heteróticas, el único candidato serio a teoría unificada de las partículas elementales, posee esta simetría). Su violación representaría otro ejemplo de ecuación simétrica con un conjunto simétrico de soluciones asimétricas, de las cuales sólo una se observa en la naturaleza. En este caso habría dos soluciones, que difieren en el sentido del tiempo.

En cualquier caso, la violación de la simetría temporal en el nivel de las partículas elementales no parece capaz de explicar la flecha (o flechas) del tiempo —las claras diferencias que observamos continuamente entre los acontecimientos que discurren hacia adelante en el tiempo y su correspondiente versión hacia atrás—. Estas diferencias surgen de las especiales condiciones iniciales en el comienzo de la expansión del universo, como ya hemos mencionado y discutiremos en detalle más adelante.

Violación de la simetría materia-antimateria

Si la operación matemática que intercambia el sentido del tiempo se combina con la que intercambia derecha e izquierda y con la que intercambia materia y antimateria, la operación resultante (llamada simetría CPT) es una simetría exacta de la teoría cuántica de campos. De modo que no debería resultar muy sorprendente que la violación espontánea de la simetría temporal suponga también la violación de la simetría entre materia y antimateria. ¿Podría esta violación ser la responsable de la enorme asimetría del mundo que nos rodea, en el que todo está compuesto de materia, mientras que la antimateria se produce sólo en colisiones raras de alta energía?

Esta proposición fue hecha hace años por el físico ruso Andréi Sajarov, bien conocido por su papel decisivo (junto a Ya. B. Zeldovich) en la construcción de la bomba de hidrógeno soviética, y más tarde por su activa lucha en pro de la paz y los derechos humanos en la antigua Unión Soviética. Sajarov elaboró un modelo teórico que ha sufrido modificaciones considerables a manos de otros físicos, pero que siempre ha incluido el siguiente punto clave: en sus primeros instantes, el universo era simétrico en lo que respecta a la materia y la antimateria, pero pronto se produjo la presente asimetría a través del mismo efecto que induce la violación espontánea de la simetría temporal. La propuesta de Sajarov parecía muy peregrina en principio, pero las sucesivas transformaciones la han mejorado cada vez más. Parece en efecto que el mecanismo responsable del predominio de la materia sobre la antimateria es una ruptura espontánea de simetría.

Espín

El bosón de Higgs implicado en el mecanismo de Anderson-Higgs para la ruptura espontánea de simetría es distinto de los cuantos mediadores de las interacciones gluónica, débil y electromagnética. Una diferencia muy importante estriba en el valor del momento angular de espín (espín para abreviar), que cuantifica la rotación de la partícula en torno a su propio eje. La mecánica cuántica suministra una unidad natural para el espín, y en términos de esta unidad un bosón puede tener espín

0, 1, 2, etc., mientras que un fermión puede tener espín 1/2, 3/2, 5/2, etc.

Todos los fermiones elementales del modelo estándar tienen espín 1/2. Todos los cuantos de la cromodinámica cuántica y de la dinámica cuántica del sabor tienen espín 1. El bosón de Higgs, en cambio, debe tener espín 0.

¿Por qué hay tantas partículas elementales?

La enorme multiplicidad de partículas elementales observadas quedó explicada tras el descubrimiento de que eran entidades compuestas —formadas de acuerdo con las reglas de la cromodinámica cuántica— a partir de quarks, antiquarks y gluones. Pero los quarks, con sus tres colores y seis sabores, y los gluones, con sus ocho (que no nueve) combinaciones de colores, constituyen un conjunto bastante numeroso de por sí. Por otra parte, fuera del reino de las partículas que interaccionan fuertemente, encontramos también el electrón, el muón, el tauón y sus respectivos neutrinos. Y todos los fermiones tienen antipartículas distintas de ellos mismos. Además, tenemos el fotón y los tres bosones intermediarios de la fuerza débil. El bosón de Higgs completa la lista de partículas elementales exigidas por el modelo estándar.

Calculemos el número total. Tenemos dieciocho quarks, tres partículas similares al electrón y tres neutrinos, lo que suma veinticuatro fermiones en total. Añadiendo sus antipartículas, hacen cuarenta y ocho. Después tenemos los cuantos conocidos: los ocho gluones, el fotón y los tres bosones mediadores de la interacción débil, lo que eleva el total a sesenta. Con el bosón de Higgs, tenemos sesenta y uno.

Para un observador profano, parece una locura suponer que las leyes básicas de toda la materia del universo puedan basarse en un conjunto de objetos fundamentales tan grande y heterogéneo. El experto en partículas elementales no puede por menos que estar de acuerdo. La solución a este rompecabezas ha de pasar por la incorporación del modelo estándar en una teoría más amplia que no contenga tantas arbitrariedades, preferiblemente una teoría unificada de todas las partículas elementales y de sus interacciones. Mientras que el modelo estándar está apoyado por una copiosa evidencia experimental, cualquier teoría unificada, en ausencia de evidencias directas que la corroboren, tiene que ser contemplada en la actualidad como mera especulación. Una teoría unificada debe ser, naturalmente, comprobable, es decir, debe hacer predicciones verificables por medio de la observación. Pero ¿cómo podría una teoría de este tipo manejar la profusión de partículas elementales con la que nos enfrentamos en el modelo estándar?

Parece haber tres modos de hacerlo. El primero consiste en suponer que las partículas elementales que hoy conocemos son en realidad entes compuestos, y que la descripción última de la materia implica un número menor de constituyentes verdaderamente fundamentales. No creo que haya en la actualidad ninguna evidencia teórica ni experimental que apunte en esta dirección. Es más, los hipotéticos nuevos constituyentes tendrían que ser también numerosos para poder explicar la gran variedad de propiedades de las partículas elementales conocidas, por lo que la reducción del número de objetos elementales que se conseguiría no sería espectacular.

Una idea relacionada con la anterior es que el proceso que acabamos de discutir (la explicación de objetos aparentemente elementales en un nivel como compuestos de objetos aún más elementales en un nivel inferior) continuará eternamente. Tal cadena de composición sin fin fue defendida por el antiguo presidente Mao en la República Popular China (cosa que quizá resulte chocante para algunos, pero hay que recordar que Lenin escribió sobre el electrón y que Stalin intervino en numerosas controversias sobre ciencia, humanidades y artes, a veces con las más desafortunadas consecuencias para sus opositores). De acuerdo con las ideas de Mao, el quark fue llamado durante un tiempo «niño estrato» en el idioma chino, evocando el término «niño fundamento» acuñado para el átomo. Bajo el mandato de Mao y la Banda de los Cuatro, no cabe duda de que para los científicos chinos no era aconsejable oponerse con demasiada vehemencia a la idea de una cadena infinita de estratos. Bajo los regímenes posteriores, más permisivos, la última incursión de Mao en la física teórica ha quedado relegada al olvido.

Una tercera posibilidad es que exista una teoría simple en la base del sistema de partículas elementales que admita un número infinito de éstas, siendo accesible a la detección experimental, dentro de las energías actualmente alcanzables, un número finito de ellas. La teoría de supercuerdas se encuadra en esta categoría de explicación.

Capítulo 14
La teoría de supercuerdas: ¿La unificación por fin?

Por primera vez en la historia, tenemos en la teoría de supercuerdas —más concretamente en la teoría de supercuerdas heteróticas— una propuesta seria para una teoría unificada de todas las partículas elementales y de sus interacciones y, por tanto, de todas las fuerzas de la naturaleza. El siguiente paso es obtener predicciones de la teoría y compararlas con lo que ya sabemos, además de lo que pronto se podrá medir, sobre las partículas elementales. Un rasgo llamativo de esta comparación es la aparición en las ecuaciones de una energía o masa característica (la masa de Planck), cerca de la cual se manifiesta directamente la total unificación de la teoría de supercuerdas. Pero la energía equivalente a la masa de Planck es enorme comparada con la escala de energía de los fenómenos detectables en el laboratorio. De modo que todas las partículas que pueden estudiarse más o menos directamente en un laboratorio pertenecen en su totalidad al «sector de masa baja» de la teoría.

El sector de masa baja

Hay cierto número de partículas, grande pero finito (pongamos entre cien y doscientas), con masas lo suficientemente pequeñas como para que aparezcan en un futuro previsible en los experimentos realizados en aceleradores. Estas partículas y sus interacciones constituyen el sector de masa baja de la teoría de supercuerdas.

El resto de partículas elementales (en número infinito) son enormemente más masivas, y su presencia sólo puede constatarse a través de efectos virtuales (tales como la generación de fuerzas por intercambio de cuantos virtuales). Algunos de estos efectos virtuales pueden resultar de importancia capital, como por ejemplo los que permiten incluir la gravitación einsteniana en el marco de la teoría sin engendrar infinitos agobiantes.

El modelo estándar, incluyendo las tres familias de fermiones, sus antipartículas y los doce cuantos conocidos, forma parte del sector de masa baja de la teoría unificada. El gravitón, de masa cero, así como otras partículas predichas, pertenece también, obviamente, al sector de masa baja.

Renormalización del modelo estándar

El modelo estándar se distingue de la teoría de la gravitación por una propiedad extraordinaria llamada renormalización. Esto significa que puede separarse como una buena aproximación del resto de la teoría unificada sin que aparezcan infinitos que hagan que los cálculos carezcan de sentido. Una parte renormalizable de la teoría unificada puede usarse por sí misma, casi como, si fuese la teoría final. Sin embargo, hay que pagar un precio por esta separación, que en el caso del modelo estándar es la aparición de más de una docena de números arbitrarios, imposibles de calcular teóricamente y que deben determinarse experimentalmente. Estos parámetros representan la dependencia del modelo del resto de la teoría fundamental unificada, incluyendo el conjunto infinito de partículas de masa alta.

La comparación con la experiencia no es imposible

Dado que las razones entre la masa de Planck y las masas de las partículas del sector de masa baja son muy grandes, unos pocos físicos teóricos y varios autores profanos han afirmado que las predicciones de la teoría son difíciles o imposibles de comprobar por medio de la observación. No obstante, tales argumentos son incorrectos. Hay muchas maneras de confrontar la teoría con los resultados experimentales:

  1. Para comenzar, la teoría de supercuerdas predice, en un límite apropiado, la teoría de la relatividad general de Einstein para la gravitación. La incorporación automática de la gravitación einsteniana dentro de una teoría cuántica de campos, sin que aparezcan los problemas habituales (los infinitos) constituye ya de por sí un gran triunfo.
  2. El siguiente reto es determinar si la teoría de supercuerdas puede predecir, con alguna aproximación, el modelo estándar.
  3. Pero recordemos que el modelo estándar tiene una gran cantidad de constantes arbitrarias (parámetros), cuyos valores deberían poderse determinar por medio de la teoría.
  4. El sector de masa baja de la teoría de supercuerdas contiene nuevas partículas adicionales, cuyas propiedades son susceptibles de predicción y comprobación experimental.
  5. En particular, el modelo estándar está incluido en un modelo renormalizable más amplio que forma parte del sector de masa baja. Las propiedades de este modelo superior, incluyendo las partículas que contiene, las constantes que describen las masas de cada una y sus interacciones, pueden compararse con los resultados experimentales.
  6. Además, los efectos virtuales del sector de masa alta pueden introducir correcciones observables en la física del sector de masa baja.
  7. Por último, la teoría de supercuerdas puede tener consecuencias cosmológicas verificables por observación astronómica.

Aunque no debemos perder la esperanza de hallar métodos para comparar las predicciones de la teoría con los hechos de la naturaleza, los teóricos deben proceder a la difícil tarea de extraer estas predicciones.

Unidades básicas de energía y otras magnitudes

¿Cuál es la enorme energía que caracteriza la teoría de supercuerdas y de dónde procede? Es la unidad básica de energía, derivada de las constantes universales de la naturaleza. Estas constantes son tres: c, la velocidad de la luz en el vacío; h, la constante de Plank, y G, la constante de gravitación de Newton.

La constante h es la razón entre la energía de cualquier cuanto de radiación y la frecuencia de vibración de esa radiación. En la práctica se suele emplear la forma h, que significa h dividido por 2n, donde 2n es la razón entre la circunferencia de cualquier círculo y su radio. (Werner Heisenberg solía llevar un alfiler de corbata en forma de h para mostrar su orgullo como descubridor de la mecánica cuántica. Este símbolo resulta tan familiar para los físicos teóricos que mi viejo amigo Stanislaw Ulam, el brillante y divertido matemático, solía describir la letra polaca 1, la ele «oscura» que aparece en su nombre, como l dividido por 2n.)

G es la constante universal de la fórmula de Newton para la fuerza gravitatoria entre dos masas puntuales, que es igual al producto de G por las dos masas dividido por el cuadrado de la distancia entre ellas. (Newton demostró que la misma fórmula podía aplicarse a dos cuerpos esféricos si la distancia que se emplea es la distancia entre sus centros. La fórmula puede emplearse aproximadamente para el Sol, los planetas y para satélites como la Luna.)

Multiplicando y dividiendo potencias adecuadas de las tres constantes universales, c, h y G, puede construirse la unidad fundamental de cualquier magnitud física, como longitud, tiempo, energía o fuerza. La longitud fundamental es del orden de un centímetro dividido por un uno seguido de treinta y tres ceros. Dividiendo esta longitud por la velocidad de la luz obtenemos la unidad de tiempo fundamental, que es del orden de un segundo dividido por un uno seguido de cuarenta y cuatro ceros.

En contraste, las unidades a las que está acostumbrada la mayoría de la gente son arbitrarias; no están construidas a partir de constantes universales de la naturaleza. Aunque un pie ya no es (si es que lo fue alguna vez) la media de la longitud de los zapatos de las diez primeras personas que salen de la iglesia un domingo por la mañana, sigue sin ser una unidad fundamental. Tampoco lo es el metro, definido en primera instancia como la longitud de una determinada barra de metal guardada en una cámara acorazada cerca de París, y en la actualidad como cierto múltiplo de la longitud de onda de la luz emitida por un átomo de kriptón en un estado particular de excitación.

La masa de las partículas y la unidad básica

La unidad fundamental de masa, la masa de Planck, es aproximadamente una cienmilésima de gramo. Ciertamente, no parece enorme a escala humana, pero en la escala de las masas del protón y el neutrón (ambas cercanas a 1 GeV) es gigantesca —veinte trillones de veces mayor—. Dando la vuelta, podemos decir que el neutrón y el protón son extremadamente pequeños en comparación con la unidad fundamental. La masa del electrón es dos mil veces más pequeña todavía. ¿A qué se deben estos números tan pequeños? La respuesta más simple es que aún no lo sabemos. La teoría de supercuerdas heteróticas no contiene ningún parámetro ajustable. Si resulta ser la teoría correcta, debe generar por sí misma, de alguna forma, las pequeñas razones entre las masas de las partículas conocidas y la masa de Planck. Una de las más severas pruebas de la teoría es verificar sobre el papel que esto efectivamente es así.

Hasta ahora, no hay más que indicios sobre la manera en que surgen estos pequeños valores en la teoría. Una conjetura bastante obvia consiste en admitir como aproximación útil que todas las partículas del sector de masa baja tienen masa nula. Las correcciones que introduce la ruptura de simetría en esta aproximación (incluyendo las inducidas por el mecanismo de Anderson-Higgs) se convierten en las responsables de las masas reales, pequeñas pero distintas de cero. Unas pocas masas, entre ellas las del fotón y el gravitón, no reciben correcciones y son efectivamente nulas.

Las energías alcanzables en los experimentos actuales son del orden de un millar de GeV; pronto podrán ser de un orden unas diez veces mayor, pero no más. Todavía serán diminutas comparadas con la unidad fundamental de energía, alrededor de los veinte trillones de GeV. Dado que los experimentadores no pueden producir en sus laboratorios partículas de masa superior a las energías disponibles en sus aceleradores, siempre trabajarán directamente con partículas pertenecientes al sector de masa baja.

El significado del término «supercuerda»

¿Qué observaciones generales pueden hacerse sobre las partículas incluidas en la teoría de supercuerdas heteróticas? La respuesta tiene que ver con el significado de la palabra cuerda y del prefijo super-.

El término cuerda indica que la teoría describe las partículas en términos de pequeños lazos, en lugar de puntos; el tamaño típico de cada lazo es del orden de la unidad fundamental de longitud, una milmillonésima de billonésima de billonésima de centímetro. Estos lazos son tan pequeños que, para la mayoría de fines, se pueden describir como partículas puntuales, de hecho una infinidad de clases de partículas puntuales. ¿Cuáles son las relaciones entre las diferentes partículas? En concreto, ¿cómo se relacionan las pertenecientes al sector de masa baja con las que tienen una masa comparable a la masa de Planck, o mayor?

Una buena analogía es una cuerda de violín, que tiene un modo fundamental de vibración y un número infinito de otros modos (armónicos) de frecuencia cada vez mayor. Pero en mecánica cuántica la energía equivale a la frecuencia multiplicada por la constante de Planck h. Las partículas del sector de masa baja pueden visualizarse como los modos fundamentales de vibración de los diversos tipos de lazo que se dan en la teoría de supercuerdas, mientras que las partículas de masa comparable a la de Planck representan armónicos, y las de masa aún mayor, armónicos de frecuencia más alta.

El prefijo super- indica que la teoría es aproximadamente «supersimétrica», es decir, que para cada fermión de la lista de partículas elementales existe un bosón correspondiente, y viceversa. Si la supersimetría del sistema de partículas fuese exacta, cada fermión tendría precisamente la misma masa que su bosón asociado. Sin embargo, la supersimetría se «rompe» por sí misma, de un modo todavía mal comprendido, lo que hace que las masas de los fermiones y bosones correspondientes estén separadas por lo que yo llamaría un «superhueco». Éste no tiene exactamente el mismo valor para cada pareja fermión-bosón, pero probablemente siempre es del mismo orden de magnitud. Si el superhueco es del orden de la masa de Planck, ya podemos desistir de observar directamente en el laboratorio los compañeros supersimétricos de las partículas conocidas.

Los compañeros supersimétricos y los nuevos aceleradores

Sin embargo, si la energía equivalente al superhueco es sólo de unos cientos o miles de GeV, estas observaciones de los compañeros supersimétricos deberían ser posibles en los próximos años, suponiendo que se acabe de construir el nuevo acelerador del CERN. (Las posibilidades hubieran sido mayores si se hubiera construido el acelerador SSC, que trabajaría con energías superiores.) El análisis teórico de los resultados de ciertos experimentos indica que el superhueco podría ser lo suficientemente pequeño para las posibilidades del SSC, y tal vez también para las del aparato del CERN. Asumiendo que esto sea cierto, pienso que la perspectiva del descubrimiento de los compañeros supersimétricos es la motivación más apasionante para la construcción de nuevos aceleradores (a la que siempre se suma la más general de explorar lo desconocido y comprobar si aparecen fenómenos imprevistos).

La nomenclatura de los hipotéticos compañeros supersimétricos sigue dos esquemas distintos. Cuando la partícula conocida es un bosón, el fermión asociado recibe un nombre que termina con el diminutivo italiano -no, empleado por primera vez (en un contexto distinto) por Fermi para bautizar al neutrino. Así, el compañero del fotón es el fotino, y el del gravitón el gravitino. Como los bosones cargados que mediatizan la interacción débil suelen denotarse por W y W, los correspondientes fermiones supersimétricos han recibido el peregrino nombre de «winos». En caso de que la partícula conocida sea un fermión, su pareja, un bosón, recibe el mismo nombre que el fermión, pero con la letra «s» como prefijo (probablemente como abreviatura de «super»). Así se obtienen nombres estrafalarios como squark, selectrón, etc. (Me gustaría dejar claro que no me considero responsable de esta nomenclatura, aunque, debo admitirlo, sí estaba presente cuando se escogió el sufijo -ino para las parejas de los bosones conocidos.)

Dado que el compañero supersimétrico de un bosón es un fermión y viceversa, los espines de los dos supercompañeros deben ser siempre diferentes, uno un número entero y el otro un semientero. De hecho, ambos espines deben diferir en 1/2. Los bosones de Higgs tienen espín 0, y sus parejas supersimétricas (higgsinos) tienen espín 1/2. Las tres familias de fermiones tienen espín 1/2, y sus parejas squarks, selectrones, etc.) tienen espín 0. Los cuantos (gluones, fotones, bosones X o W y Zº) tienen espín 1, y sus compañeros (gluinos, íotinos, etc.) tienen espín 1/2. El gravitón tiene espín 2 y el gravitino 3/2.

En la teoría de supercuerdas, el modelo estándar queda englobado en una teoría renormalizable más grande, que podemos llamar modelo superestándar, el cual contiene los veinte cuantos, los fermiones usuales y algunos bosones de Higgs, junto con las parejas supersimétricas de todas estas partículas. Las predicciones del modelo superestándar proporcionan maneras de comprobar experimentalmente la validez de la teoría de supercuerdas.

La aproximación a la masa de Planck

Al aumentar la energía y abandonar el sector de masa baja —el único directamente accesible a la experimentación— la teoría de supercuerdas predice que las interacciones gluónica, electromagnética y débil deben aproximarse en intensidad y revelar su íntima relación. (La extrapolación de los resultados experimentales actuales a las altas energías conduce a la misma conclusión, si se tiene en cuenta la rotura de la supersimetría y un superhueco no excesivamente grande. Así pues, se puede decir que ya hay evidencias indirectas de la supersimetría.) Al mismo tiempo, las simetrías entre los fermiones comienzan a imponerse.

Dejemos que la energía continúe aumentando. Podría suceder que, en un dominio de energía inmediatamente inferior a la masa de Planck, el modelo superestándar dejase paso a una versión supersimétrica de una «teoría de gran unificación» antes de manifestar, en la vecindad de la masa de Planck, los primeros estados excitados de supercuerdas.

Aunque ninguno de nosotros vivirá para ver energías comparables a la masa de Planck producidas en el laboratorio, estas energías eran comunes cuando el universo comenzó a expandirse. La unidad fundamental de tiempo, una cienmillonésima de trillonésima de trillonésima de segundo, es una medida del período en que el universo experimentó todos los efectos físicos de la teoría de supercuerdas. ¿Hay alguna evidencia cósmica remanente que pueda probar la validez de la teoría de supercuerdas a través de sus efectos en aquel crucial aunque remoto episodio?

Los teóricos no están seguros de que exista evidencia alguna. Aquel breve lapso fue seguido, casi con toda certeza, por un período de inflación, una expansión explosiva del universo, seguida de la expansión más gradual que observamos hoy. La inflación barrió prácticamente muchas de las características del universo primitivo, y pudo haber borrado así muchas de las consecuencias de la teoría de supercuerdas. Sin embargo, las ligaduras que esta teoría impone sobre el carácter de la inflación quizá permitan, después de todo, que pueda ser comprobada a través de la cosmología.

El mismo tipo de razonamiento se aplica también a las condiciones iniciales del universo, que, de acuerdo con Hartle y Hawking, están ligadas a la teoría cuántica de campos unificada. Asumiendo que tanto su modelo como la teoría de supercuerdas son correctos, las condiciones iniciales del universo quedan unívocamente determinadas, aunque sus efectos sobre el universo ulterior tienen que pasar por el filtro del período de inflación.

Multiplicidad aparente de soluciones

Además de la gran disparidad entre la escala de energía característica de la teoría de supercuerdas y las energías alcanzables en los experimentos, hay otra razón por la que algunos físicos han expresado dudas acerca de la verificabilidad de la teoría. Tiene que ver con el descubrimiento de numerosas soluciones aproximadas de las ecuaciones de la teoría de supercuerdas heteróticas.

Cada una de estas soluciones proporciona, entre otras cosas, una relación de las partículas que tienen, dentro de la aproximación considerada, masa nula. Es razonable asumir que estas partículas son las mismas que conforman el sector de masa baja de la teoría cuando se incluyen las pequeñas correcciones de masa. Las partículas sin masa de cada solución aproximada pueden compararse con las del modelo superestándar. Para ciertas soluciones, se observa un buen acuerdo: el sector de masa baja contiene el modelo superestándar y unas pocas partículas adicionales, entre ellas el gravitón y el gravitino.

El problema que surge es que han aparecido miles de soluciones aproximadas y, según parece, surgirán muchas más. Por tanto, no resulta de ningún modo imposible que la situación observada sea compatible con una solución de la teoría de supercuerdas, pero ¿qué hacemos con el resto de soluciones?

Hay varias respuestas posibles. Una es, por supuesto, que la teoría esté equivocada, pero creo que no hay razones para sacar una conclusión tan drástica de la existencia de una plétora de soluciones aproximadas. Otra posibilidad es que los problemas se deban exclusivamente a la aproximación (que no está ni mucho menos completamente justificada, sino que simplemente resulta conveniente), y que cuando ésta sea mejorada todas las soluciones menos una carezcan de sentido y puedan ser abandonadas. (Una versión modificada de esta posibilidad es que sobrevivan únicamente unas pocas soluciones.)

Acción

Para considerar el resto de posibles respuestas al problema de las soluciones múltiples, es útil sacar a colación una importante magnitud física denominada acción, designada habitualmente por el símbolo S. Fue introducida en la física clásica newtoniana hace mucho tiempo y se demostró muy útil, pero con la llegada de la mecánica cuántica pasó de ser útil a ser esencial. (La acción tiene unidades de energía por tiempo; h, la constante de Planck dividida por 2n, tiene idénticas dimensiones y puede considerarse la unidad fundamental de acción.) Recordemos que las probabilidades de las historias no detalladas en mecánica cuántica son integrales sobre los valores de la magnitud D para parejas de historias completamente detalladas. Una teoría asigna, dentro de la mecánica cuántica, un valor particular de S a cada historia detallada, y son estos valores de la acción (junto con las condiciones iniciales) los que determinan el valor de D.

Resulta muy deseable encontrar una fórmula para S en términos de la teoría de supercuerdas heteróticas. Sin embargo, hasta ahora, esta fórmula se ha mostrado escurridiza. Lo único que parece factible, hoy por hoy, es expresar la acción como una serie infinita —como han demostrado los trabajos de mi antiguo discípulo Barton Zwiebach, Michio Kaku y un grupo de Kioto—, aunque la sumación de esta serie continúa siendo una tarea formidable.

Puede resultar clarificador comparar la situación con un ejercicio que emprendió Dick Feynman en 1954. (Discutió conmigo su proyecto una vez que visité Caltech en 1954, cuando acepté un empleo que me ofrecieron allí. De hecho, yo mismo había iniciado un proyecto similar.) Feynman comenzó por imaginar que la brillante intuición de Einstein acerca de la naturaleza de la gravitación — que tenía que obedecer el principio de equivalencia de la relatividad general y estar relacionada con la geometría del espacio-tiempo— nunca se produjo. Dick se preguntó si sería posible, sin dicha intuición, construir una teoría por la fuerza bruta. Descubrió que, en efecto, sí lo era. Sin embargo, la acción venía expresada por una serie infinita, cuya suma era virtualmente imposible en ausencia de la perspectiva geométrica y el principio de equivalencia. Este principio, la relatividad general, conduce a una respuesta directa, sin necesidad de la fuerza bruta ni de sumas infinitas. De hecho, una vez Einstein comprendió, sobre la base de la relatividad general, el tipo de fórmula que necesitaba para describir la gravitación, su antiguo compañero de estudios Marcel Grossman le enseñó las matemáticas que precisaba para escribir la fórmula de la acción, de la cual puede derivarse la ecuación que figura al final del capítulo 7.

Tal vez la situación en la teoría de supercuerdas sea similar. Si los teóricos descubriesen el principio de equivalencia de la teoría de supercuerdas, estarían en disposición de escribir la fórmula para la acción de manera directa, sin recurrir a series infinitas. (Mientras esperamos a que lo descubran, ¿cómo debería llamarse este principio? ¿Relatividad mariscal? ¿Relatividad generalísimo? Ciertamente, va más allá de la relatividad general.) En cualquier caso, el hallazgo de la fórmula para la acción S supondrá una comprensión muy profunda de la teoría de supercuerdas.

Como ya dijimos antes, la motivación que condujo a la teoría de supercuerdas fue, en primer lugar, el principio de autoconsistencia, una idea simple y poderosa que todavía no ha sido formulada en el lenguaje adecuado para descubrir la acción o el principio de supersimetría subyacente a ésta. Cuando la teoría de supercuerdas se exprese en el lenguaje de la teoría cuántica de campos y se hayan descubierto su acción y sus simetrías, entonces habremos llegado al comienzo de una nueva era.

Acción efectiva

A partir de la acción, uno podría en principio calcular una magnitud relacionada que denotaré con el símbolo S. Un teórico la llamaría «acción euclídea con correcciones cuánticas», o algo por el estilo. Es una especie de promedio de una versión modificada de la acción S, modificación que implica una alteración del carácter de la variable tiempo. Podemos referirnos a S como «acción efectiva». Desempeña un papel importantísimo en la interpretación de la teoría. En primer lugar, Hartle y Hawking expresarían las condiciones iniciales del universo en términos de S. En segundo lugar, si realmente la teoría de supercuerdas conduce a tantas soluciones, hay que buscar en S una guía. De alguna manera, esta magnitud, calculada para las diferentes soluciones, debe discriminar entre ellas.

Razonando a partir de la física clásica, donde el principio de mínima acción proporciona un método elegante para formular la dinámica newtoniana, algunos teóricos podrían argüir que la solución correcta con sentidofísico —la que caracteriza el universo real— sería la que tiene un menor valor para la acción efectiva S. Éste podría ser, en efecto, el criterio acertado para elegir la solución correcta.

Sin embargo, ya que estamos enmarcados en la mecánica cuántica, podría ser que no hubiese una única solución correcta para el universo, sino una situación probabilística en la que todas las soluciones correctas son alternativas posibles, cada una con su propia probabilidad, menor cuanto mayor sea S. En realidad, la fórmula para la probabilidad en función de S sería una exponencial decreciente, descrita por una curva similar a la de la página 153. La solución correspondiente al mínimo valor de S tendría la máxima probabilidad de caracterizar el universo, pero las otras soluciones también tendrían alguna oportunidad.

La ramificación de las soluciones

La solución particular que se aplica al universo determinaría la estructura del sistema de partículas elementales. De hecho, haría más que eso. Lo más singular es que determinaría también el número de dimensiones del espacio.

Para tratar el aspecto espacial de las supercuerdas heteróticas la teoría parte de una descripción del espacio-tiempo con una dimensión temporal y nueve dimensiones espaciales; las diversas soluciones corresponden entonces al colapso de algunas de estas dimensiones espaciales, quedando las restantes como observables. Si se aplica la interpretación probabilística de S, el carácter tridimensional del espacio en nuestro universo es consecuencia de la realización arbitraria de una solución particular de las ecuaciones de supercuerdas (como lo es, por ejemplo, la existencia de un número determinado de familias fermiónicas que contienen determinado número de partículas).

Este carácter probabilístico es el resultado más sorprendente de los intentos actuales por resolver el problema de las aparentemente múltiples soluciones de las ecuaciones de la teoría de supercuerdas. Supongamos que es correcto. Entonces podemos concebir el árbol de historias no detalladas alternativas del universo, cada una con su propia probabilidad, comenzando con una primera ramificación que selecciona una solución particular de las ecuaciones de supercuerdas.

Las predicciones de la teoría de supercuerdas, dependan o no de tal «elección» probabilística de la solución, tendrán que ser comparadas con nuestra experiencia del espacio tridimensional, así como con las propiedades del sistema de partículas elementales.

Si finalmente la teoría de supercuerdas heteróticas hace predicciones correctas en todos los casos en que sea factible comprobarlas, seguramente habremos resuelto el problema de la teoría fundamental de las partículas elementales. La dinámica subyacente a la evolución del estado del universo será conocida. Pero la descripción de su historia todavía depende de sus condiciones iniciales, así como de los sucesos aleatorios que acaecieron en todas las bifurcaciones del árbol de la historia universal.

¿Universos múltiples?

La cosmología cuántica que hemos discutido hasta aquí se ha referido a historias alternativas del universo, tratado como una entidad singular que abarca toda la materia. Pero esta disciplina está en un estado dinámico y abunda en ideas especulativas de gran interés, cuya plausibilidad es todavía objeto de discusión; algunas de estas ideas se refieren, de una u otra forma, a universos múltiples. Dado que el prefijo uní- significa uno, esta expresión parece contradictoria, y tal vez un nuevo término ayudaría a evitar las confusiones lingüísticas que podrían surgir si estas ideas resultasen ser, al menos parcialmente, correctas. Podemos emplear la palabra «multiverso» para referirnos a todo el conjunto de universos, uno de los cuales es el que nos es familiar.

La introducción de los universos múltiples carece de sentido a menos que el nuestro sea autónomo en gran medida. Una propuesta es que los otros son «universos bebé», creados y destruidos virtualmente en procesos cuánticos, de forma muy similar a los cuantos virtuales que mediatizan las fuerzas en la teoría cuántica de campos. Según la interpretación de Stephen Hawking y otros, la creación y destrucción virtual de universos bebé altera el resultado de los cálculos en la teoría de partículas elementales, aunque no desafía de manera esencial el concepto de árbol ramificado para la historia de nuestro universo.

Otra de las posibilidades sugeridas es que haya numerosos universos, muchos de ellos de tamaño comparable al nuestro, pero cuyo contacto mutuo, si es que existe, es muy limitado, incluso en el pasado remoto o en el futuro lejano. En este cuadro, los universos serían como burbujas dentro del multiverso, burbujas que se separaron mutuamente hace mucho tiempo, inaugurando una era de aislamiento que perduraría por un tiempo inconcebiblemente grande. Si la interpretación de los universos múltiples resulta tener alguna validez, uno podría intentar determinar qué ocurre en las diversas burbujas con diferentes ramificaciones posibles de la historia del universo. Se abre así la puerta a la fantástica idea de un árbol ramificado de historias no detalladas, todas las cuales se realizan de hecho, pero en diferentes universos burbuja. La probabilidad de cada historia sería entonces esencialmente estadística, la fracción de los diversos «universos» en los que tiene lugar esa historia en particular.

Supongamos ahora que la interpretación probabilística de las múltiples soluciones aproximadas de la teoría de supercuerdas es correcta, de modo que hay muchas soluciones verdaderas asociadas con conjuntos diferentes de partículas elementales y diverso número de dimensiones espaciales. Si realmente existen múltiples universos como burbujas dentro de un multiverso, entonces podrían caracterizarse por soluciones diferentes de la teoría de supercuerdas, cuya frecuencia de aparición disminuiría exponencialmente con el valor de la acción efectiva S.

Aunque estas especulaciones teóricas se demuestren sin fundamento, la noción de universos múltiples e independientes no deja de proporcionar una forma hermosa (aunque bastante abstracta) de pensar probabilísticamente en el marco de la cosmología cuántica.

«Principios antrópicos»

Algunos cosmólogos cuánticos hacen referencia al llamado principio antrópico, principio que requiere que las condiciones del universo sean compatibles con la existencia de seres humanos. En su formulación débil este principio establece simplemente que la rama particular de la historia en la que nos encontramos posee las características necesarias para que exista nuestro planeta y florezca en él la vida, incluyendo el hombre. Formulado de esta manera, el principio antrópico es trivial.

Sin embargo, en sus formulaciones más fuertes, este principio se aplicaría supuestamente a la dinámica de las partículas elementales y a las condiciones iniciales del universo, modelando de alguna forma las leyes fundamentales para que produzcan seres humanos. Esta idea me parece tan ridicula que no merece más discusión.

No obstante, he intentado encontrar alguna versión del principio antrópico que no sea trivial ni absurda. Lo mejor a lo que he llegado es lo siguiente. Entre las diversas soluciones de las ecuaciones fundamentales (si es que en verdad hay múltiples soluciones) y entre las diversas ramas de la historia, ciertas soluciones y ciertas ramas dan lugar en muchos lugares a condiciones favorables para la evolución de sistemas complejos adaptativos, que pueden actuar como IGUS (sistemas acumuladores y utilizadores de información) observadores de los resultados de las ramificaciones mecanocuánticas (esas condiciones incluyen el predominio de una situación apropiada intermedia entre el orden y el desorden). La caracterización de estas soluciones y ramas representa un problema muy interesante, que podría llamarse, supongo, la búsqueda de un principio IGUSico. Una consecuencia menor de la existencia de condiciones favorables a los IGUS sería que la existencia de la Tierra, de la vida sobre ella y de los seres humanos sería posible y se daría de hecho en ciertas ramas de la historia.

Una aplicación de estas investigaciones teóricas podría ser el refinamiento de los cálculos sobre la probabilidad de recibir señales de sistemas complejos adaptativos inteligentes procedentes de estrellas remotas (uno de los objetivos del proyecto SETI [Search of Extra Terrestrial Intelligence] de búsqueda de inteligencia extraterrestre). Muchos factores influyen en tales cálculos. Uno de ellos es el período de tiempo probable en que una civilización tecnológica sería capaz de perdurar y de transmitir (e interesarse en transmitir) señales, antes de que una guerra catastrófica o el declive tecnológico acabe con ella. Otro factor es la probabilidad de que un planeta pueda albergar sistemas complejos adaptativos similares, por ejemplo, a los que habitan la Tierra. Aquí entran en consideración cuestiones sutiles. Por ejemplo, Harold Morowitz, en su investigación de las condiciones requeridas por la atmósfera de la Tierra en la época de las reacciones químicas prebióticas que dieron origen a la vida, ha llegado a la conclusión de que para que estas reacciones tengan lugar se necesitan condiciones muy restrictivas. Otros expertos, no obstante, no son de la misma opinión.

En lugar de algún imponente «principio antrópico», nos enfrentamos más bien con un conjunto de cuestiones teóricas, fascinantes pero bastante convencionales, sobre las condiciones necesarias para la evolución de sistemas complejos adaptativos en las diferentes ramas de la historia y en diversos lugares y momentos, dada la teoría fundamental de las partículas elementales y el estado cuántico inicial del universo.

El papel de las condiciones iniciales

Nos hemos topado varias veces con el papel de las condiciones iniciales en el establecimiento del orden que, en el universo primitivo, hizo posible la evolución subsiguiente de objetos celestes como galaxias, estrellas y planetas, y después la aparición de sistemas complejos adaptativos. Hemos discutido también una de las consecuencias más notables de este estado inicial: el fluir del tiempo hacia adelante en todo el universo. Vamos a explorar este fluir del tiempo con más detalle.

Capítulo 15
Las flechas del tiempo. Tiempo hacia adelante y hacia atrás

Recordemos el ejemplo del meteorito atravesando la atmósfera y estrellándose contra el suelo. Si proyectásemos hacia atrás una filmación de toda la escena, reconoceríamos al instante que el tiempo había sido invertido. Sabemos que la razón última de la unidireccionalidad del tiempo es que el universo se encontraba en un estado muy especial hace unos quince mil millones de años. Mirando hacia atrás en el tiempo hasta aquella configuración simple, contemplamos lo que llamamos pasado; mirando en el otro sentido, vemos cómo se extiende ante nosotros lo que llamamos futuro.

La compacidad del estado inicial del universo (en la época de lo que algunos llaman el Big Bang) no caracteriza por completo su simplicidad. Después de todo, los cosmólogos consideran posible, incluso probable, que en algún momento futuro inconcebiblemente lejano el universo vuelva a colapsarse en una estructura muy pequeña. Si así fuera esa estructura sería, sin embargo, bien diferente de su análoga en el pasado. Los acontecimientos no se reproducirían hacia atrás en el tiempo durante el período de colapso. La idea de que la expansión y la contracción deberían ser simétricas es lo que Stephen Hawking llama «su mayor error».

Radiación y registros

Es fácil pensar en la diferencia entre uno y otro sentido del tiempo. Por ejemplo, los cuerpos calientes como las estrellas y las galaxias irradian energía. La forma más común de radiación consiste en fotones —como los de la luz, las radioondas y los rayos gamma, que hacen posible la astronomía óptica, la radioastronomía y la astronomía de rayos gamma, respectivamente—. Además, está comenzando a plantearse la astronomía de neutrinos, y algún día tendremos astronomía de ondas gravitatorias. Todas estas formas de astronomía están basadas en la detección de flujos de energía emitidos en forma de partículas y ondas. De forma similar, cuando percibimos la luz procedente de una llama o una lámpara incandescente, nuestros ojos están detectando un flujo de fotones. Si se invirtiese el curso del tiempo, en cada uno de estos casos la energía fluiría hacia el interior de los cuerpos. Los flujos salientes de energía pueden transportar señales: si una estrella se transforma en supernova y adquiere un brillo enorme durante cierto tiempo, esta información se propaga hacia el exterior a la velocidad de la luz.

Otra diferencia entre el pasado y el futuro es la existencia de registros del pasado, como las trayectorias dejadas en la mica por las partículas cargadas emitidas por núcleos radiactivos desintegrados tiempo atrás. Los registros similares de desintegraciones futuras son notorios por su ausencia. Esta asimetría entre pasado y futuro es tan evidente que tendemos a pasarla por alto.

Los seres humanos empleamos las radiaciones para enviar señales y los registros para conocer el pasado. Incluso creamos y guardamos nuestros propios registros. Pero la existencia de señales y registros en general es independiente de la existencia de sistemas complejos adaptativos —como nosotros— que los empleen para sus propios fines.

Las condiciones iniciales y la causalidad

La asimetría temporal de señales y registros es parte del principio de causalidad física, que afirma que los efectos siguen a las causas. La causalidad física puede trazarse directamente hasta la existencia de unas condiciones iniciales simples del universo. Pero ¿cómo intervienen en la teoría estas condiciones iniciales?

La fórmula mecanocuántica para la magnitud D, que nos da las probabilidades de las diferentes historias alternativas del universo, contiene ya la asimetría entre pasado y futuro. En un extremo, correspondiente a lo que llamamos pasado, contiene una descripción del estado cuántico inicial del universo primitivo, lo que podemos llamar sus condiciones iniciales. En el otro extremo, correspondiente al futuro remoto, la fórmula contiene una integral sobre todos los posibles estados del universo. Esta integral puede describirse como una condición de completa indiferencia en cuanto al estado del universo en el futuro lejano.

Si las condiciones iniciales fuesen también de completa indiferencia, no habría entonces causalidad ni historia. En vez de eso, el estado inicial es simple y especial (tal vez el descrito por Hartle y Hawking, que no requiere más información que la de las leyes dinámicas que gobiernan el sistema de partículas elementales).

Si las condiciones del futuro no fuesen de completa indiferencia, se darían violaciones del principio de causalidad que conducirían a sucesos inexplicables (o al menos altamente improbables) en términos del pasado, pero que serían requeridos (o casi) por las condiciones especificadas para el futuro lejano. Al aumentar la edad del universo, se producirían más y más de estos sucesos. No hay evidencia alguna de tal predestinación, y sí pruebas considerables en su contra. De modo que, en ausencia de argumentos convincentes, podemos descartar la posibilidad de que las condiciones del futuro sean algo distinto a la completa indiferencia. Aun así, aunque relegada al dominio de la ciencia ficción o la superstición, una condición especial sobre el futuro puede considerarse una alternativa interesante, aunque contraria a los hechos, en contraste con la causalidad a la que estamos acostumbrados.

A partir de la fórmula mecanocuántica para las probabilidades de las historias, y con unas condiciones iniciales adecuadas, es posible deducir todos los aspectos familiares de la causalidad, como las señales y registros orientados del pasado al futuro. Todas las flechas del tiempo corresponden a diferentes rasgos de las historias no detalladas del universo, y la fórmula muestra la tendencia de todas estas flechas a señalar hacia adelante en lugar de hacerlo hacia atrás.

Entropía y segunda ley

De entre las flechas que marcan la diferencia entre pasado y futuro, la más famosa es la tendencia de la magnitud denominada entropía a aumentar (o al menos a no disminuir) en un sistema cerrado, lo que conduce al principio conocido como segunda ley de la termodinámica. (Según un viejo chiste de físicos, la primera ley de la termodinámica dice que no puedes ganar, y la segunda dice que tampoco puedes empatar. Ambas leyes resultan frustrantes para los constructores de máquinas de movimiento perpetuo.) La primera ley establece la conservación de la energía: la energía total de un sistema cerrado permanece constante. La segunda ley, que establece el aumento (o la constancia) de la entropía, es más sutil, pese a que en realidad la entropía es un concepto muy familiar en nuestra vida cotidiana. Es una medida de desorden, y ¿quién puede negar que el desorden tiende a aumentar en un sistema cerrado?

Si uno se pasa la tarde en una mesa ordenando monedas según su fecha de acuñación o clavos según su tamaño, y alguien pasa y golpea la mesa, ¿no es enormemente probable que las monedas o los clavos vuelvan a desordenarse? Si en casa los niños están untando tostadas con mantequilla y mermelada, ¿acaso no tiende la mantequilla a mezclarse con la mermelada, y la mermelada con la mantequilla? Si una cámara está dividida en dos por un separador, con oxígeno en el lado izquierdo y una cantidad igual de nitrógeno en el derecho, ¿no es cierto que al retirar el separador se obtendrá con seguridad una mezcla de oxígeno y nitrógeno en ambas partes?

La explicación de estos fenómenos es que hay más formas de tener clavos o monedas desordenados que ordenados. Hay más maneras de tener mantequilla y mermelada mutuamente contaminadas que en estado puro. Y hay muchas más formas de tener oxígeno y nitrógeno con sus moléculas mezcladas que segregadas. Siempre que opere el azar, es probable que un sistema cerrado ordenado evolucione hacia el desorden, dado que éste le ofrece muchas más posibilidades.

Microestados y macroestados

¿Cómo pueden enumerarse estas posibilidades? Un sistema cerrado, descrito con total precisión, puede existir en una variedad de estados, denominados microestados. En mecánica cuántica, estos microestados se entienden como los posibles estados cuánticos del sistema. Los microestados se agrupan en categorías (denominadas macroestados) de acuerdo con diversas propiedades distinguibles macroscópicamente. Los microestados de un macroestado dado se consideran equivalentes, de modo que sólo se tiene en cuenta su número.

Consideremos el caso de la cámara que contiene igual número de moléculas de oxígeno y nitrógeno separadas por un tabique, que es retirado a continuación. Ahora, el número de microestados posibles de las moléculas de oxígeno y nitrógeno pueden agruparse en macroestados de la siguiente manera: aquellos en los que la parte izquierda de la cámara contiene menos de un 10% de nitrógeno y la parte derecha menos de un 10% de oxígeno; aquellos en los que la mezcla está entre un 10% y un 20%; aquellos en los que está entre un 20% y un 30%, etc. Los macroestados en los que la contaminación está entre un 40% y un 50% (o entre un 50% y un 60%) contienen la mayoría de microestados. Son también los macroestados más desordenados, aquellos en los que los gases están más mezclados.

En realidad, la definición técnica de la entropía (medida en la unidad más conveniente, la llamada constante de Boltzmann) está íntimamente relacionada con el número de maneras diferentes en que un sistema cerrado puede encontrarse en un macroestado particular. La entropía de un sistema en un macroestado dado es, aproximadamente, la cantidad de información —el número de bits— necesaria para especificar uno de los microestados correspondientes al macroestado, considerando todos los microestados como igualmente probables.

Recordemos que en el juego de las veinte preguntas, si se juega a la perfección, pueden obtenerse 20 bits de información para adivinar la cosa desconocida una vez se sabe que es animal, vegetal o mineral. Veinte bits corresponden a la información necesaria para distinguir entre 1 048 676 alternativas diferentes igualmente probables, que resultan de multiplicar 2 por sí mismo 20 veces. Análogamente, 3 bits corresponden a 8 posibilidades igualmente probables, porque 8 es igual a 2 multiplicado por sí mismo 3 veces. Cuatro bits corresponden a 16 posibilidades, 5 bits a 32, etc. Si el número de posibilidades está entre 16 y 32, el número de bits está entre 4 y 5.

De esta manera, si el número de microestados de un macroestado dado es 32, la entropía del sistema en ese macroestado es de 5 unidades. Si el número de microestados es 16, la entropía es 4, etc.

Entropía e ignorancia

La entropía y la información están estrechamente relacionadas. De hecho, la entropía puede considerarse como una medida de la ignorancia. Cuando lo único que se sabe es que un sistema está en determinado macroestado, la entropía mide el grado de ignorancia sobre el microestado particular en que se halla el sistema, para lo cual se cuenta el número de bits de información adicional necesaria para especificarlo, considerando equiprobables todos los microestados correspondientes a ese macroestado.

Supongamos ahora que nuestro sistema no se encuentra en un macroestado definido, sino que ocupa varios macroestados con distintas probabilidades. La entropía de los macroestados será el promedio sobre ellos, según sus respectivas probabilidades. La entropía incluye así una contribución adicional del número de bits de información requeridos para especificar el macroestado. La entropía puede definirse por tanto como el promedio de la ignorancia acerca del microestado dentro del macroestado más la ignorancia acerca del propio macroestado.

Especificación corresponde a orden e ignorancia a desorden. La segunda ley de la termodinámica establece simplemente que un sistema cerrado de baja entropía (orden elevado) tenderá, al menos a largo plazo, a desplazarse hasta un estado de mayor entropía (más desorden). Dado que hay más formas de que un sistema esté desordenado que ordenado, la tendencia es a desplazarse hacia el desorden.

La explicación última: Orden en el pasado

Una cuestión más profunda es por qué no es aplicable este mismo argumento cuando se invierte el sentido del tiempo. ¿Por qué la filmación de un sistema, proyectada al revés, no puede mostrárnoslo moviéndose hacia una situación de desorden, en lugar de hacia el orden? La respuesta a esta pregunta reside en última instancia en el estado inicial simple del universo al comienzo de su expansión hace unos diez mil millones de años, en contraste con la condición de indiferencia aplicable al futuro lejano. No sólo la flecha del tiempo causal apunta hacia el futuro por esta razón, sino también las demás, incluida la flecha «termodinámica», que apunta del orden al desorden. La condición original del universo condujo a la condensación gravitatoria de la materia y a la formación de las galaxias. Al envejecer ciertos tipos de galaxias, se formaron dentro de ellas estrellas y sistemas planetarios que envejecieron a su vez. La flecha del tiempo se transfiere del universo a las galaxias, y de éstas a las estrellas y planetas. Señala hacia adelante en el tiempo en todos los puntos del universo. En la Tierra se comunica al origen de la vida y a su evolución, y al nacimiento y envejecimiento de todos los seres vivos. Virtualmente todo el orden en el universo surge a partir de un orden en el pasado y, en última instancia, del estado inicial ordenado del universo. Por ello la transición del orden a un desorden estadísticamente mucho más probable tiende a proceder en todas partes del pasado al futuro, y no al revés.

Metafóricamente, podemos imaginar el universo como un antiguo reloj al que se le ha dado cuerda al principio de su expansión y que desde entonces va perdiéndola a la vez que engendra relojes menores con algo de cuerda, que a su vez van perdiéndola y engendrando más relojes. En cada etapa, siempre que se forma una nueva entidad, hereda de las estructuras previamente existentes la propiedad de tener un poco de cuerda. Podemos identificar el envejecimiento de cada entidad aislada con la pérdida de cuerda de su correspondiente reloj interno.

¿Cómo se comportan galaxias, estrellas y planetas cuando envejecen? Consideremos lo que ocurre con ciertos objetos estelares familiares. En el centro de las estrellas similares al sol se producen reacciones nucleares que, a temperaturas de decenas de millones de grados, convierten hidrógeno en helio, liberando la energía que surge de la superficie del astro. La estrella agota finalmente su combustible nuclear y su carácter cambia, a veces de modo drástico. Si es lo suficientemente masiva, puede ocurrir que se transforme repentinamente en una supernova para, tras brillar con enorme intensidad durante unos meses, colapsarse después en un agujero negro. Este proceso es claramente unidireccional en el tiempo.

Cuando los seres humanos componemos un patrón ordenado (con monedas sobre una mesa, por ejemplo) y lo abandonamos junto a un agente perturbador (pongamos un perro), el sistema cerrado conjunto (monedas sobre una mesa más perro) evolucionará hacia un estado desordenado porque el desorden es más probable. El cambio se producirá hacia adelante en el tiempo, porque nos comportamos causalmente, como cualquier cosa que evolucione de pasado a futuro, creando primero el patrón ordenado y dejándolo luego solo con el perro. Tal situación implica un aumento en la entropía no muy distinto del que se produce en estrellas y galaxias.

Lo que es distinto es el establecimiento en primer lugar de los patrones ordenados: ordenar monedas o reordenarlas después de que el perro haya cargado contra ellas. Ello implica una disminución de la entropía del conjunto de monedas, que no viola el segundo principio de la termodinámica porque las monedas no están aisladas. De hecho, la segunda ley asegura que la entropía del entorno y de la persona que realiza la reordenación ha de aumentar como mínimo tanto como disminuya la entropía de las monedas.

¿Cuáles son los síntomas del aumento de entropía en la persona y en el entorno?

El demonio de Maxwell

Para dar respuesta a esta pregunta, es útil considerar un demonio hipotético que se pasa el tiempo ordenando: el demonio de Maxwell, imaginado por el mismo James Clerk Maxwell que desarrolló las ecuaciones del electromagnetismo. Maxwell estudiaba una aplicación muy común (y tal vez la primera) de la segunda ley de la termodinámica: el comportamiento de un cuerpo caliente y otro frío puestos en contacto. Imaginemos una cámara dividida en dos partes por un tabique móvil. En un lado tenemos gas caliente y en el otro el mismo gas frío. La cámara es un sistema cerrado con una cierta cantidad de orden, dado que las moléculas del gas caliente, más rápidas por término medio, están separadas de las del gas frío del otro lado, en promedio más lentas.

Supongamos en primer lugar que el tabique es metálico y conduce el calor. Todo el mundo sabe que el gas caliente tendrá tendencia a enfriarse y el gas frío a calentarse, hasta que ambas muestras alcancen la misma temperatura. La segunda ley requiere que ocurra precisamente esto, porque así desaparece la segregación entre gas caliente y frío y aumenta la entropía.

Supongamos ahora que el tabique no es conductor, de modo que se mantiene la separación entre gas frío y caliente. La entropía permanecerá entonces constante, lo que sigue siendo compatible con la segunda ley. ¿Pero qué ocurriría si hubiese un demonio que ordenase las moléculas según su velocidad? ¿Disminuiría la entropía?

El demonio de Maxwell vigila ahora una trampilla en el tabique, que sigue siendo no conductor. Controla las moléculas que vienen de ambos lados y estima su velocidad. Las moléculas del gas caliente sólo son más rápidas que las del gas frío desde el punto de vista estadístico'; cada muestra contiene moléculas que se mueven a diferentes velocidades. Nuestro perverso demonio, manipulando la trampilla, sólo permite que pasen las moléculas más lentas del lado caliente al lado frío, y las más rápidas del frío al caliente. De esta manera, el gas frío recibe moléculas extremadamente lentas, enfriándose aún más, mientras que el gas caliente recibe moléculas extremadamente rápidas, con lo cual se calienta todavía más. Desafiando aparentemente la segunda ley de la termodinámica, el demonio ha provocado un flujo de calor del gas frío al caliente. ¿Qué es lo que ha sucedido?

Dado que la segunda ley sólo se aplica a sistemas cerrados, debemos incluir al demonio en nuestros cálculos. Su incremento de entropía debe ser al menos tan grande como la disminución experimentada por la cámara. ¿Cómo se las apaña el demonio para aumentar su entropía?

Una nueva contribución a la entropía

Leo Szilard dio un primer paso para resolver la cuestión en 1929, introduciendo la relación entre entropía e información. Más tarde, tras la segunda guerra mundial, Claude Shannon estableció formalmente la noción matemática de información, clarificada posteriormente por el físico teórico francés Léon Brillouin. El concepto de complejidad algorítmica o contenido de información algorítmica fue introducido en los años sesenta por Kolmogorov, Chaitin y Solomonoff. Finalmente, Rolf Landauer y Charlie Bennett, de IBM, desarrollaron en detalle la conexión de la información y el contenido de información algorítmica con la actividad de personas, demonios o dispositivos que reducen la entropía de un sistema físico, aumentado la suya propia en una cantidad igual o superior.

Bennett demostró que un dispositivo que adquiera y registre (sobre papel o cinta magnética, por ejemplo) la clase apropiada de información sobre un sistema físico, puede usar la información registrada para producir un flujo de calor de un objeto frío a uno caliente, siempre y cuando le quede papel o cinta magnética. La entropía del sistema formado por los cuerpos caliente y frío decrece, pero al precio de gastar papel o cinta. Landauer había demostrado con anterioridad que borrar los registros, sin dejar ninguna copia, produce un aumento de entropía que como mínimo compensa la disminución. Finalmente, el dispositivo agota su capacidad de registro y así, a largo plazo, cuando se borran registros para dejar sitio a otros nuevos, la segunda ley de la termodinámica queda restablecida.

Ya hemos mencionado que es el borrado de la última copia de la información lo que debe producir un aumento de entropía que compense la disminución. En realidad, es probable que el borrado de cualquier copia conlleve en la práctica un incremento similar de entropía, pero es únicamente la última copia la que debe hacerlo en principio. La razón es que si existen dos copias hay métodos para, en ciertas condiciones, emplear una de ellas para «descopiar» la otra reversiblemente, sin ningún incremento de la entropía convencional.

Mientras tanto, es posible mantener de alguna forma la segunda ley incluso durante el período en que los registros existen y se hace uso de ellos para corregir la definición de entropía del sistema entero. Esto se consigue incluyendo un término igual al contenido de información algorítmica de los registros relevantes supervivientes. Dado que el contenido de información algorítmica sólo depende de la longitud del menor programa que describe la información, su valor no queda alterado por la existencia de copias extra de los registros. Lo único que importa es que exista al menos una copia de cada registro.

La conveniencia de esta definición corregida de entropía ha sido señalada por Wojtek Zurek, del Laboratorio Nacional de Los Alamos y miembro del Instituto de Santa Fe. Podemos pensar en la nueva definición como sigue: la entropía usual, que es una medida de desinformación, queda modificada por la adición del contenido de información algorítmica de los registros que contienen la información correspondiente. Esto representa una especie de intercambio de desinformación por registros. Cuando se obtiene y registra información, disminuye la desinformación a la vez que aumenta la información en los registros. Cuando se procede a borrar registros, la información de éstos disminuye y la desinformación de todo el sistema cerrado aumenta como mínimo en la misma cantidad.

Borrado y fragmentación

En el desempeño de su tarea, el demonio debe hacer algo con la información que adquiere sobre las moléculas individuales. Almacenando esta información, llegará un momento en que agotará el espacio disponible para registrarla. Al borrar información, aumenta la entropía del demonio y la de su entorno. Ahora bien, ¿qué se entiende por borrado definitivo?

Pensemos en una anotación a lápiz, que borramos con una goma de borrar ordinaria. El borrado desprende pequeños fragmentos de la goma, cada uno de los cuales se lleva una pequeña porción de lápiz, que quedan dispersos sobre la mesa o el suelo. Esta clase de dispersión del orden es en sí misma un aumento de entropía. De hecho, el proceso de borrado típico produce un incremento de entropía mucho mayor que la cantidad de información borrada, gran parte del cual tiene un carácter convencional (por ejemplo, la generación de calor). Hay que señalar, sin embargo, que estamos ignorando esta producción de entropía extra, y nos concentramos exclusivamente en el incremento de entropía mínimo que debe acompañar la destrucción de la información en los registros.

Una cuestión importante es la irreversibilidad de la destrucción. Si el proceso puede revertirse, reconstruyendo lo anotado a partir de los fragmentos de goma de borrar, entonces el incremento de entropía asociado específicamente con el borrado no ha tenido lugar —ni tampoco el propio borrado: existe una copia de la información en los fragmentos de goma.

Podría objetarse que tal reconstrucción siempre es posible en principio, que recobrar la información de los pedacitos de goma sólo es un problema de orden práctico. Un ejemplo espectacular de esto lo ofrecieron los «estudiantes» que ocuparon la embajada estadounidense en Teherán en 1979. Recogieron los trozos de los documentos clasificados que habían sido destruidos en el último momento y, pacientemente, volvieron a componerlos y sus contenidos se hicieron públicos.

Aunque ahora las máquinas para destruir documentos los cortan en ambas dimensiones, lo que hace su reconstrucción mucho más difícil, todavía continúa siendo posible en principio. ¿Cómo podemos entonces hablar de un borrado o dispersión de información irreversible, o incluso de la destrucción de cualquier tipo de orden? ¿Es un fraude el propio concepto de entropía, la transformación de orden en desorden?

La entropía es inútil sin ausencia de detalle

Retomemos a nuestras moléculas de oxígeno y de nitrógeno mezclándose en un depósito. Podemos cuestionar en qué sentido el mezclado aumenta el desorden, dado que cada molécula de oxígeno y de nitrógeno está en algún lugar en cada momento (en la aproximación clásica, al menos) y, por tanto, la situación en cada instante está tan ordenada como en cualquier instante previo (siempre que se describa la posición de cada molécula, y no sólo la distribución de oxígeno y nitrógeno).

La respuesta es que la entropía, como la complejidad efectiva, el contenido de información algorítmica y otras magnitudes antes definidas, depende de la resolución —el grado de detalle con que se describe el sistema—. Matemáticamente, es totalmente correcto que la entropía de un sistema descrito con una resolución máxima no aumente en absoluto; siempre permanece constante. Sin embargo, un sistema con muchas partes se describe siempre en términos de unas pocas variables, y el orden en estas variables tiende a dispersarse con el tiempo en otras variables donde deja de ser considerado como tal. Éste es el sentido real de la segunda ley de la termodinámica.

Podemos pensar también en la resolución en términos de macroestados. Lo normal es que un sistema inicialmente descrito dentro de uno o unos pocos macroestados se encuentre más tarde en una mezcla de muchos, al mezclarse los macroestados como consecuencia de la evolución dinámica del sistema. Además, los macroestados compatibles con el mayor número de microestados tendrán tendencia a predominar en las mezclas. Por estas dos razones el valor final de la entropía tiende a ser mayor que el inicial.

Podemos intentar conectar la resolución aquí descrita con la introducida en el marco de la mecánica cuántica. Recordemos que un dominio cuasiclásico maximal consiste en historias alternativas del universo tan detalladas como sea posible sin que se pierda su decoherencia y carácter casi clásico. Ya dijimos antes que, en mecánica cuántica, un dominio cuasiclásico determina una especie de mínimo teórico para la resolución del universo, correspondiente, en la descripción de un objeto individual, a un máximo de individualidad. Este mismo mínimo puede aplicarse a la resolución propia de la definición de entropía. Cuando se hace así, los macroestados más refinados que pueden utilizarse para definir la entropía son los pertenecientes al dominio cuasiclásico.

La entropía de la complejidad algorítmica

La elección de nuestro demonio entre almacenaje o borrado es la misma a la que se enfrenta cualquier máquina real (o una persona u otro organismo) que crea orden. Si almacena toda la información que adquiere, puede reducir la entropía (definida convencionalmente) del universo como máximo en una cantidad igual al contenido de información algorítmica de la información almacenada. Cuando borra información para dejar espacio, el universo recupera como mínimo la misma entropía que perdió. Si se corrige la definición de entropía para incluir el contenido de información algorítmica de la información almacenada, la segunda ley de la termodinámica no se viola nunca, ni siquiera temporalmente.

La contribución del contenido de información algorítmica a la entropía corregida podría llamarse entropía de la complejidad algorítmica. A menudo es muy pequeña comparada con la entropía usual. Pero aunque represente una contribución insignificante, sigue siendo muy importante, porque cuantifica la posibilidad de utilizar información para burlar la segunda ley convencional, temporalmente al menos, hasta que se borren los registros.

Las flechas del tiempo y las condiciones iniciales

La flecha del tiempo termodinámica puede trazarse desde el estado inicial simple del universo hasta su estado final de indiferencia, dentro de la fórmula mecanocuántica que da las probabilidades para las historias no detalladas decoherentes del universo. Lo mismo puede afirmarse de la flecha del tiempo asociada con la radiación emitida, y también de lo que yo califico como verdadera flecha del tiempo cosmológica, relacionada con el envejecimiento del universo y sus partes componentes. (Stephen Hawking define su propia flecha del tiempo cosmológica a través de la expansión del universo, pero ésta no es una auténtica flecha del tiempo según mi definición. Si tras un lapso de tiempo fantásticamente grande el universo se contrae, esta contracción también tendrá lugar hacia adelante en el tiempo; el envejecimiento continuará, como el propio Hawking señala.)

La flecha del tiempo asociada con la formación de registros deriva también en última instancia del estado inicial simple del universo. Finalmente, la llamada flecha psicológica del tiempo, referente a la experiencia del paso del tiempo por parte de los seres humanos y los demás sistemas complejos adaptativos, surge igualmente de la misma condición. Los recuerdos no son más que registros, y obedecen el principio de causalidad como cualesquiera otros.

La emergencia de mayor complejidad: Accidentes congelados

El paso del tiempo parece brindar oportunidades para el incremento de la complejidad. También sabemos que la complejidad puede descender, como por ejemplo en una sociedad forzada a retroceder a esquemas sociales más simples a causa de fuertes presiones por parte del clima, los enemigos o las disensiones internas. Tales sociedades pueden llegar a desaparecer (el derrumbamiento de la civilización maya clásica tuvo que ver seguramente con una reducción de su complejidad, aunque muchos individuos aislados sobrevivieran). No obstante, al pasar el tiempo sigue apareciendo una complejidad social cada vez mayor. La misma tendencia se observa en la evolución biológica. Aunque algunas transformaciones pueden implicar un descenso en la complejidad, la tendencia es hacia una mayor complejidad máxima. ¿Por qué?

Recordemos que la complejidad efectiva es la longitud de una descripción concisa de las regularidades de un sistema. Algunas de estas regularidades pueden atribuirse en última instancia a las leyes fundamentales que gobiernan el universo. Otras surgen del hecho de que muchas características de una cierta parte del universo se encuentran relacionadas entre sí en un momento dado por su origen común en algún acontecimiento remoto. Estas características tienen rasgos comunes y muestran información mutua. Por ejemplo, los automóviles de un cierto modelo se parecen entre sí porque todos proceden del mismo diseño, el cual contiene muchos rasgos arbitrarios que podrían haber sido de otra manera. Estos «accidentes congelados» pueden manifestarse de múltiples formas. Mirando las monedas del rey Enrique VIII de Inglaterra, podemos reflexionar sobre todas las referencias a este monarca, no sólo en las monedas, sino también en cartas, documentos relativos a la incautación de monasterios y libros de historia, y también sobre cómo hubiesen cambiado todas estas cosas si su hermano mayor Arturo hubiese sobrevivido para ocupar el trono en su lugar. ¡Y de qué manera habría cambiado la historia subsiguiente a partir de este accidente congelado!

Ahora podemos arrojar algo de luz sobre algunas cuestiones profundas mencionadas al principio de este volumen. Si encontramos una moneda con la efigie de Enrique VIII, ¿cómo podemos emplear las ecuaciones dinámicas fundamentales de la física para deducir que deberían aparecer otras monedas como ésta? Al encontrar un fósil en una roca, ¿cómo podemos deducir a partir de las leyes fundamentales que probablemente habrá más fósiles de la misma clase? La respuesta es la siguiente: sólo especificando las condiciones iniciales del universo junto con las leyes dinámicas fundamentales. Entonces podemos servimos del árbol de historias ramificadas y razonar, partiendo del estado inicial y de la causalidad resultante, que la existencia de la moneda o fósil descubiertos implica la ocurrencia de determinados sucesos en el pasado que los produjeron, y que es probable que estos sucesos produjesen otras monedas o fósiles similares. Sin las condiciones iniciales del universo, las leyes dinámicas de la física no podrían conducimos a tal conclusión.

Un accidente congelado puede explicar también, como ya hemos discutido, por qué los cuatro nucleótidos denotados en forma abreviada por A, C, G y T constituyen el ADN de todos los organismos vivos de la Tierra. Los planetas que giran en torno a estrellas lejanas quizás alberguen sistemas complejos adaptativos muy parecidos a los de la Tierra, pero cuyo material genético esté compuesto de otras moléculas. Según algunos teóricos del origen de la vida, puede haber miles de alternativas al conjunto A, C, G y T. (Hay que decir que otros sostienen que el juego familiar de nucleótidos podría ser la única posibilidad real.)

Un candidato a accidente congelado más probable todavía es la presencia de ciertas moléculas dextrógiras que juegan un importante papel en la bioquímica terrestre, mientras que las correspondientes moléculas levógiras no desempeñan ninguno, llegando a faltar por completo en las formas de vida terrestres. No es difícil comprender por qué diversos grupos de moléculas dextrógiras serían mutuamente compatibles en bioquímica, y lo mismo puede decirse de las levógiras; pero ¿qué fue lo que determinó la elección entre unas y otras?

Algunos físicos teóricos han intentado desde hace tiempo conectar esta asimetría izquierda- derecha con el curioso comportamiento de la interacción débil, que muestra una tendencia levógira en la materia ordinaria (compuesta de quarks y electrones) y una tendencia dextrógira en la antimateria (formada por antiquarks y positrones). No parece que sus esfuerzos hayan tenido éxito, y es más probable que la asimetría izquierda-derecha en bioquímica sea un rasgo congelado del ancestro de todas las formas de vida actuales, siendo perfectamente posible que las cosas hubiesen sucedido de otra manera.

La asimetría biológica entre izquierda y derecha ilustra de modo llamativo cómo muchos accidentes congelados pueden contemplarse como el resultado de una ruptura espontánea de simetría.

Puede haber un conjunto simétrico de soluciones (en este caso, moléculas levógiras y dextrógiras), de las cuales sólo una acontece en una parcela del universo y en un intervalo de tiempo dados. En física de partículas elementales, se piensa que ejemplos típicos de ruptura espontánea de simetría se aplican a todo el universo. (Pudiera haber otros ejemplos, también en física de partículas elementales, que se aplicasen a regiones gigantescas del universo, pero no a la totalidad. Si así fuese ¡incluso esta disciplina tendría, en cierto sentido, carácter de ciencia medioambiental!)

La estructura arborescente de las historias ramificadas implica un juego de azar en cada bifurcación. Cualquier historia no detallada individual surge de los resultados particulares de cada una de estas jugadas. Con el transcurso del tiempo, la historia registra un número creciente de tales resultados aleatorios. Pero algunos de esos accidentes se congelan en forma de reglas para el futuro, al menos en alguna parcela del universo. De modo que el número de regularidades posibles sigue aumentando con el tiempo y con ellas las posibilidades de complejidad.

Este efecto no se restringe ni mucho menos a los sistemas complejos adaptativos. La evolución de las estructuras físicas muestra la misma tendencia hacia la emergencia de formas más complejas a través de la acumulación de accidentes congelados. Fluctuaciones aleatorias dieron origen a galaxias y cúmulos de galaxias en el universo primitivo; la existencia de cada uno de estos objetos, con sus características individuales, ha constituido, desde el momento de su aparición, una importante regularidad en su parcela de universo. Análogamente, la condensación de estrellas —incluyendo las estrellas múltiples y las dotadas de sistemas planetarios— a partir de las nubes de gas de esas galaxias creó nuevas regularidades de gran importancia local. A medida que aumenta la entropía del universo —el desorden general—, la autoorganización puede producir orden local, como en los brazos de una galaxia espiral o en la multiplicidad de formas simétricas de los copos de nieve.

La complejidad de un sistema en evolución en un momento dado (sea un sistema complejo adaptativo o no adaptativo) no proporciona medida alguna del grado de complejidad que el sistema o sus descendientes (reales o figurados) puedan alcanzar en el futuro. Para superar esta dificultad hemos introducido con anterioridad el concepto de complejidad potencial. Para definirla, consideramos las posibles historias futuras del sistema y promediamos su complejidad efectiva en cada instante futuro sobre esas historias, cada una de las cuales se pondera de acuerdo con su probabilidad. (La unidad de tiempo natural en este caso es el intervalo medio entre dos cambios aleatorios en el sistema.) La complejidad potencial resultante, como función del tiempo futuro, nos indica algo sobre la probabilidad de que el sistema evolucione hacia una mayor complejidad, tal vez generando una clase completamente nueva de sistema complejo adaptativo. En el ejemplo que presentamos anteriormente, la complejidad potencial distinguiría la emergencia de los seres humanos de la de los otros grandes simios, aunque su complejidad efectiva en el momento de su aparición no fuese muy diferente. Análogamente, se podría distinguir así la superficie de un planeta con una probabilidad significativa de generar vida en un determinado lapso de tiempo de la de otro en que la vida apenas tuviera posibilidades.

¿Continuará por siempre la emergencia de mayor complejidad?

Tras un enorme intervalo de tiempo (incluso para los estándares cosmológicos) el universo, en su continua expansión, se hará muy diferente de como es ahora. Las estrellas morirán; los agujeros negros, mucho más numerosos que en la actualidad, se desintegrarán; probablemente hasta los protones (y los núcleos más pesados) se desintegrarán también. Todas las estructuras que ahora nos parecen familiares desaparecerán. Las regularidades se harán cada vez más escasas, y el universo se describirá principalmente en términos de azar. La entropía será muy elevada, así como el contenido de información algorítmica, de modo que la complejidad efectiva será baja y la profundidad también (ver Figuras 4 y 8).

Si este cuadro es correcto, la emergencia de formas cada vez más complejas se frenará gradualmente hasta detenerse, momento en el cual la regla será la regresión a formas de menor complejidad. Además, las condiciones ya no conducirán a la existencia de sistemas complejos adaptativos. Hasta la individualidad entrará en declive, al volverse cada vez más escasos los objetos individuales.

Este escenario no está en absoluto exento de controversia. Es necesaria una mayor investigación teórica sobre el futuro lejano. Aunque no tiene demasiado valor práctico inmediato, esta investigación arrojará luz sobre el significado de la era de complejidad en que vivimos. El universo podría dirigirse, pasado muchísimo tiempo, a un nuevo colapso; los teóricos estudian también este fenómeno, intentando averiguar cómo podría seguir aumentando la entropía en un universo que se encoge, y cuáles serían las perspectivas para la complejidad en esta fase de la evolución cósmica.

Mientras tanto, las características de nuestro planeta y nuestro Sol han producido accidentes congelados que afectan profundamente a las leyes de la geología, la meteorología y otras ciencias «medioambientales». En particular, han proporcionado la base para la biología terrestre. La evolución de la Tierra, del clima, de las reacciones químicas prebióticas que condujeron a la aparición de la vida, y de la propia vida, ilustran la acumulación de accidentes congelados que se han convertido en regularidades dentro de regiones limitadas del espacio y el tiempo. La evolución biológica en especial ha dado origen a la emergencia de una complejidad efectiva cada vez mayor.

Parte III
Selección y adaptación

Capítulo 16
La selección en la evolución biológica y otros ámbitos

Los sistemas complejos adaptativos de todo tipo, incluida la evolución biológica, operan de acuerdo con la segunda ley de la termodinámica. Ahora bien, los antievolucionistas aducen de vez en cuando que la evolución biológica, de la que emergen formas cada vez más complejas, representa un incremento temporal del orden que está en clara contradicción con esta segunda ley. Es un argumento erróneo por diversas razones.

Primero, como ha sido descrito con anterioridad, también en la evolución de sistemas no adaptativos como galaxias, estrellas, planetas y rocas emergen formas cuya complejidad aumenta con el tiempo, sin que eso entre en conflicto con el incremento de entropía. Las estructuras que surgen envejecen de acuerdo con la segunda ley, pero la distribución de complejidad se amplía con el tiempo, con un incremento gradual de la complejidad máxima.

Segundo, la segunda ley de la termodinámica se aplica únicamente a sistemas cerrados (esto es, completamente autocontenidos). Quienes pretenden ver una contradicción entre la segunda ley y la evolución biológica cometen el error crucial de fijarse sólo en los organismos sin tener en cuenta el entorno.

La razón más obvia que impide considerar a los sistemas vivos como sistemas cerrados es la necesidad de luz solar como fuente de energía directa o indirecta. Estrictamente hablando, no podemos esperar que se cumpla la segunda ley de la termodinámica a menos que se tenga en cuenta la absorción de energía solar. Por otra parte, la energía fluye tanto hacia dentro como hacia fuera del sistema, perdiéndose al final en forma de radiación (piénsese en la radiación térmica emitida desde nuestras casas hacia el frío y oscuro cielo nocturno). El flujo de energía a través de un sistema puede generar orden localmente.

Además de este efecto, hay que tener en cuenta la influencia de la información procedente del medio ambiente terrestre. Para ver lo que ocurre cuando se incluye dicha información, considérese un caso extremadamente simple en que la influencia ejercida por el ambiente es estable y se ignora la interacción entre las diferentes clases de organismos. Se deja entonces evolucionar una población de un determinado organismo en un medio ambiente constante. Con el tiempo, la población tiende a adaptarse mejor a su entorno a través de la competencia entre los diversos genotipos presentes, unos con más éxito que otros en la creación de fenotipos que sobreviven y se reproducen. En consecuencia, una cierta discrepancia informacional entre el entorno y el organismo se va reduciendo gradualmente, un proceso que recuerda el modo en que las temperaturas de un objeto frío y otro caliente en contacto mutuo se aproximan al equilibrio térmico, de conformidad con la segunda ley de la termodinámica. La evolución biológica, lejos de contradecir dicha ley, proporciona metáforas instructivas de la misma. El proceso de adaptación es en sí mismo una especie de envejecimiento de la población dentro de su medio ambiente.

En los manantiales calientes sulfurosos de todo el mundo (y en las profundidades oceánicas donde los surtidores de agua caliente marcan los límites entre placas tectónicas) proliferan organismos primitivos denominados extremófilos (o crenarqueotas) en un entorno que la mayoría de seres vivos encontraría extremadamente hostil. En la vida de los extremóflos del fondo oceánico la luz juega un papel reducido, limitado principalmente a procesos que suministran productos químicos oxidados. La luz, por ejemplo, mantiene otras formas de vida cerca de la superficie del agua, desde la que cae continuamente materia orgánica hacia el hábitat de los extremóflos.

Hay evidencias indirectas que sugieren con fuerza la existencia, hace más de tres mil millones de años, de organismos que eran similares, por lo menos desde el punto de vista metabólico, a los modernos extremóflos. Nadie sabe si los genotipos de aquellos organismos eran también similares o si parte del genoma habría experimentado una deriva genética sustancial sin afectar de modo significativo a los resultados de las presiones selectivas en el mundo real. En cualquier caso, se puede decir que el difícil problema de vivir en ambientes calientes, ácidos y sulfurosos fue resuelto cuando la Tierra era joven. Los extremóflos alcanzaron una especie de estado estacionario, algo parecido a un equilibrio evolutivo con sus alrededores.

Pero raramente el medio ambiente es tan estable. La mayoría de situaciones naturales son más dinámicas, con cambios medioambientales significativos a lo largo del tiempo. Un ejemplo es la composición de la atmósfera de la Tierra, que en gran medida se debe a la presencia de la vida. La existencia de cantidades significativas de oxígeno en la actualidad puede atribuirse, al menos en gran parte, a las plantas que han proliferado en la superficie del planeta en el pasado.

Especies en coevolución

El medio ambiente de los organismos de cualquier especie incluye un número enorme de otras especies que evolucionan a su vez. El genotipo de cada organismo, o bien el conjunto de genotipos que caracteriza a cada especie, puede contemplarse como un esquema que incluye una descripción de muchas de las otras especies junto con sus reacciones probables ante diferentes formas de comportamiento. Una comunidad ecológica consiste entonces en un gran número de especies que desarrollan modelos de los hábitos de las otras especies y de cómo tratar con ellas.

En algunos casos es una idealización útil considerar sólo dos especies en coevolución, respondiendo cada una a los progresos de la otra. Por ejemplo, en mis caminatas por las selvas de Sudamérica me he encontrado a menudo con una especie de árbol que suministra alimento a una especie de hormiga particularmente agresiva. A cambio la hormiga repele a muchos animales, humanos incluidos, que podrían dañar el árbol. Igual que yo he aprendido a reconocer estos árboles para evitar tropezar accidentalmente con ellos, otros mamíferos han aprendido a evitar ramonear en ellos. Esta simbiosis tiene que ser fruto de un sustancial periodo de coevolución.

En estas mismas selvas pueden observarse relaciones ofensivo-defensivas fruto también de la evolución de dos especies adaptándose mutuamente. Un árbol puede desarrollar la capacidad de exudar una sustancia tóxica capaz de repeler algún insecto destructivo. El insecto puede, a su vez, desarrollar la capacidad de metabolizar el veneno, que deja así de constituir un peligro. La evolución posterior del árbol puede tener como resultado una modificación del veneno que lo haga activo de nuevo, y así sucesivamente. Tales carreras de armamentos químicos desembocan muchas veces en la producción de agentes bioquímicos muy potentes. Algunos de ellos pueden ser muy útiles en medicina, control de plagas y otros campos.

En las situaciones reales no simplificadas muchas especies evolucionan juntas en el seno de una comunidad ecológica, con un entorno no vivo que se altera gradualmente (o incluso rápidamente) con el tiempo. Esto está lejos de los ejemplos idealizados de simbiosis o competencia entre dos especies, así como éstos son más complicados que el caso aún más ideal de una sola especie evolucionando en un medio ambiente inmutable. En todos los casos el proceso evolutivo es compatible con la flecha del tiempo termodinámica, siempre que se tenga en cuenta la totalidad del sistema; pero sólo en las situaciones más simples, como es el caso de los extremófilos, la evolución conduce a una especie de estado estacionario informacional. En general, se trata de un proceso de cambio dinámico continuo, semejante a los que tienen lugar en el seno de sistemas fisicoquímicos complejos como una galaxia, una estrella o un planeta carente de vida. Todos envejecen y decaen con el paso del tiempo, aunque de una manera complicada.

En una comunidad ecológica, el proceso de adaptación mutua a través de la evolución es un aspecto de este envejecimiento. La evolución biológica es parte del proceso de decaimiento que tiende a reducir el intervalo informacional entre las tendencias potenciales y las reales. Una vez existe un sistema complejo adaptativo, el descubrimiento y explotación de oportunidades es no sólo posible, sino probable, porque el sistema es empujado en esta dirección por las presiones selectivas que operan sobre él.

Equilibrio puntuado

La evolución biológica no suele proceder a un ritmo más o menos uniforme, como imaginaban algunos especialistas. En vez de eso tiende a exhibir lo que se llama un «equilibrio puntuado», en el que las especies (así como los grupos taxonómicos de orden superior: géneros, familias y demás) permanecen relativamente inmutables, al menos en lo que respecta al fenotipo, durante largos periodos de tiempo y después experimentan cambios comparativamente rápidos en un breve lapso de tiempo. Stephen Jay Gould, que propuso esta idea en diversos artículos técnicos escritos en colaboración con Niles Eldredge, ha publicado una extensa literatura sobre el tema en sus amenos artículos y libros populares.

¿Cuál es la causa de los cambios comparativamente rápidos que constituyen las puntuaciones? Los mecanismos posibles pueden dividirse en varias categorías. Una comprende alteraciones, a veces generalizadas, en el entorno fisicoquímico. Hacia el fin del periodo Cretácico, hace unos 65 millones de años, al menos un objeto de gran tamaño, el que formó el enorme cráter de Chicxulub en la península del Yucatán, colisionó con la Tierra. Los cambios atmosféricos resultantes contribuyeron a la extinción del Cretácico, en la que desaparecieron los dinosaurios y muchas otras formas de vida. Cientos de millones de años antes, durante el periodo Cámbrico, se abrieron multitud de nichos ecológicos que fueron ocupados por nuevas formas de vida (algo parecido al modo en que la aparición de una tecnología nueva y popular crea numerosos puestos de trabajo). Estas formas de vida propiciaron a su vez la aparición de nuevos nichos, y así sucesivamente. Algunos teóricos de la evolución conectan esta explosión de diversidad con un incremento en el contenido de oxígeno de la atmósfera, pero esta hipótesis no es aceptada todavía por todo el mundo.

Otra categoría de cambio rápido que puede puntuar el aparentemente estacionario equilibrio evolutivo tiene un carácter eminentemente biológico, y no requiere cambios repentinos importantes en el entorno físico. Es el resultado de la tendencia del genoma a experimentar cambios graduales que no afectan profundamente la viabilidad del fenotipo. Como resultado de este proceso de «deriva», el conglomerado de genotipos que constituye una especie puede desplazarse hacia una situación inestable en la que cambios genéticos ínfimos pueden alterar radicalmente el fenotipo. Puede ocurrir que en un momento dado cierto número de especies de entre las que constituyen una comunidad se estén aproximando a este tipo de inestabilidad, creando una situación propicia para la ocurrencia de mutaciones que conduzcan a importantes cambios fenotípicos en uno o más organismos. Estos cambios pueden iniciar una sucesión de acontecimientos en que algunos organismos tienen más éxito y otros mueren, la totalidad de la comunidad se altera y se abren nuevos nichos ecológicos. Tales trastornos pueden provocar cambios en las comunidades vecinas a través de, por ejemplo, la migración de nuevas especies de animales que entran en competencia con las residentes. Se ha producido una puntuación en el seno de un equilibrio temporal aparente.

Sucesos umbral

Determinados hechos biológicos especialmente cruciales son a veces responsables de ejemplos sobresalientes de equilibrio puntuado en ausencia de cambios radicales en el entorno fisicoquímico. Harold Morowitz, que trabaja en la Universidad George Mason y en el Instituto de Santa Fe, señala la gran importancia de las rupturas o sucesos umbral que abren nuevos abanicos de posibilidades, a veces relacionadas con funciones o niveles de organización superiores. Harold ha resaltado especialmente los casos en que estos umbrales son únicos o casi, o bien dependen de una innovación bioquímica.

Para comenzar, teoriza sobre los posibles umbrales químicos en el curso de la evolución prebiótica que condujo al origen de la vida sobre la Tierra. Estos umbrales incluyen:

  1. El que condujo al metabolismo energético con empleo de la luz solar y así a la posibilidad de una membrana aislando una porción de materia, el prototipo de la célula.
  2. El que proporcionó la catálisis para la transición de los cetoácidos a los aminoácidos y de ahí a la producción de proteínas; y
  3. Reacciones químicas que dieron como resultado moléculas denominadas heterociclos dinitrogenados y que llevaron a los nucleótidos que constituyen el ADN, permitiendo así la existencia del genoma, el esquema o paquete de información biológico.

En todos estos casos Harold destaca la estrechez del umbral. Sólo unas pocas reacciones químicas especiales hacen posible la entrada en un nuevo dominio, y a veces es una sola reacción la responsable. (La especificidad de tales reacciones no significa que sean improbables. Incluso una reacción única puede tener lugar fácilmente.)

En la evolución biológica tuvieron lugar sucesos umbral análogos que condujeron al desarrollo de todas las formas de vida actuales a partir de la forma ancestral. Muchos de estos sucesos dieron origen a nuevos niveles de organización. Un ejemplo es la evolución de los eucariotas, organismos cuyas células poseen un núcleo verdadero (que contiene la fracción principal del material genético) y también otros «orgánulos» (mitocondrias o cloroplastos). La transformación de organismos más primitivos en eucariotas unicelulares es para muchos investigadores fruto de la incorporación de otros organismos que se convirtieron en endosimbiontes (es decir, que vivían dentro de la célula y en simbiosis con ella) y evolucionaron después hasta convertirse en orgánulos.

Otro ejemplo es la evolución de los eucariotas unicelulares animales (presumiblemente los ancestros de los animales propiamente dichos). Se piensa que los eucariotas vegetales fotosintéticos aparecieron antes, provistos de una pared celular de celulosa además de una membrana interior (la aparición de membranas requirió otro evento bioquímico, la formación de esteroles, compuestos relacionados con el colesterol y las hormonas sexuales humanas). La evolución condujo después a organismos desprovistos de pared celular que podían dedicarse a devorar organismos fotosintéticos en lugar de efectuar la fotosíntesis por sí mismos. Esta innovación fue la clave para la posterior aparición de los animales propiamente dichos.

La evolución de organismos pluricelulares a partir de organismos unicelulares, presumiblemente a través de la agregación, fue posible gracias a otra innovación bioquímica, un adhesivo que mantenía unidas las células.

Harold Morowitz y otros piensan que, al menos en muchos casos, un pequeño cambio en el genoma —producto de una o a lo sumo unas pocas mutaciones, pero culminando una larga serie de cambios anteriores— puede disparar un suceso umbral e iniciar así una de las revoluciones que representan una puntuación capital dentro de la relativa estabilidad del equilibrio evolutivo. Una vez dentro del dominio abierto por el evento, el organismo adquiere regularidades nuevas y significativas que lo elevan a un nivel más alto de complejidad.

Como ocurre con las perturbaciones físicas de gran magnitud, como un terremoto (o la colisión de la Tierra con otros objetos dentro del sistema solar), tales acontecimientos capitales pueden contemplarse como eventos individuales de gran trascendencia, o bien como sucesos inusuales de gran magnitud en la cola de una distribución que comprende eventos de mucha menor magnitud en su mayoría.

Agregación resultante en niveles de organización superiores

En la evolución de una comunidad ecológica, un sistema económico o una sociedad, igual que en la evolución biológica, se van presentando ocasiones para un incremento de la complejidad. El resultado es que la complejidad máxima tiende a aumentar. Los incrementos de complejidad más fascinantes son los que tienen que ver con una transición a un nivel de organización superior, típicamente a través de la formación de agregados, como en la evolución de los animales y vegetales pluricelulares a partir de organismos unicelulares.

Familias o bandas de seres humanos pueden agruparse para formar una tribu. Un grupo de personas puede aunar sus esfuerzos para ganarse la vida montando una empresa. En el año 1291, tres cantones, a los que pronto se unió un cuarto, formaron una confederación que con el tiempo se convertiría en la moderna Suiza. Las trece colonias norteamericanas se unieron en una confederación que más tarde, ratificando la constitución de 1787, se convirtió en una república federal llamada Estados Unidos. La cooperación conducente a la agregación puede ser efectiva.

Aunque la competencia entre esquemas es una característica de los sistemas complejos adaptativos, los sistemas mismos pueden exhibir una mezcla de competencia y cooperación en sus interacciones mutuas. A menudo resulta beneficioso para estos sistemas unirse formando una entidad colectiva que funciona también como un sistema complejo adaptativo, por ejemplo cuando en un sistema económico personas y empresas operan bajo las normas de un gobierno que regula su comportamiento para promover valores importantes para el conjunto de la comunidad.

Esquemas cooperativos

También entre esquemas en competencia es posible a veces que se establezca una cooperación ventajosa. En el dominio de las teorías, por ejemplo, las nociones en competencia no siempre son mutuamente excluyentes. A veces la síntesis de varias ideas está más cerca de la verdad que cualquiera de ellas por separado. Pero quienes proponen una aproximación teórica particular saben que es más fácil obtener recompensas en la vida académica y en otros ámbitos pretendiendo que la propuesta propia es absolutamente correcta y enteramente nueva, y arguyendo que los puntos de vista alternativos son erróneos y deben ser descartados. Aunque en algunos campos y en ciertos casos este modo de actuar podría estar justificado, en muchas ocasiones resulta contraproducente.

En arqueología y otras áreas de la antropología, por ejemplo, hay desde hace tiempo encendidas disputas acerca de la difusión de los rasgos culturales frente a la invención independiente. Sin embargo, parece obvio que ocurren ambas cosas. La invención del cero en la India (desde donde llegó a Europa a través del trabajo de al Khwaritzmi) parece, con una evidencia abrumadora, haber sido independiente de su invención en Centroamérica (donde fue empleado por los antiguos mayas). Si hubieran existido contactos de alguna clase entre ambos mundos resultaría muy extraña la casi total ausencia de la rueda en las culturas precolombinas (por lo que sé sólo se ha encontrado en unos pocos juguetes de procedencia mejicana) cuando se conocía desde hace tanto tiempo en el Viejo Mundo. El arco y la flecha parecen haberse difundido de Norteamérica a Centroamérica, mientras que muchas otras innovaciones culturales, como la domesticación del maíz, lo hicieron en sentido contrario. ¿Cómo pueden los eruditos dividirse todavía en difusionistas y no difusionistas?

Algunos antropólogos culturales gustan de señalar las razones ecológicas y económicas que hay detrás de costumbres tribales que a primera vista pueden parecer arbitrarias o irracionales. Aunque este enfoque es muy valioso, a veces les lleva a ridiculizar la idea misma de que la irracionalidad y la arbitrariedad puedan jugar un importante papel en los sistemas de creencias y modelos de conducta social. Seguramente esto es ir demasiado lejos; un enfoque más razonable debería atemperar el deterninismo ecológico y económico con una medida de la volubilidad de los esquemas tribales. Por ejemplo, una prohibición particular en la dieta, digamos la de comer okapis, podría tener sentido para cierta tribu, dadas las necesidades nutricionales de la población y el trabajo necesario para cazar un okapi en comparación con la obtención de otros alimentos en el contexto ecológico del bosque circundante. Pero la restricción también podría surgir de una identificación anterior del okapi con el tótem de la tribu; o bien ambas causas podrían estar en el origen de la prohibición. ¿Es acaso razonable insistir en que el enfoque correcto es siempre uno o es siempre el otro?

Una de las virtudes del Instituto de Santa Fe es que se ha creado un clima intelectual en el que eruditos y científicos se sienten mucho más inclinados que en sus instituciones de procedencia a compartir ideas y buscar maneras de armonizarlas en una síntesis fructífera cuando se considera conveniente. En una ocasión se organizó allí un seminario impartido por varios profesores de una misma universidad y un mismo departamento que comprobaron con cierto asombro que en Santa Fe se podía discutir constructivamente sobre temas que en su casa sólo provocarían disputas.

En la evolución biológica, lo más cercano a los esquemas cooperativos es probablemente la genética de la reproducción sexual, en la que los genotipos de los progenitores se mezclan en sus descendientes. Volveremos pronto a la reproducción sexual, pero primero exploraremos un poco más la tendencia hacia una mayor complejidad.

¿Existe una tendencia hacia una mayor complejidad?

Hemos visto que la dinámica de la evolución biológica puede ser complicada. Pero a menudo ha sido descrita de manera simplista. La emergencia de formas cada vez más complejas se ha tomado más de una vez por una progresión continua hacia alguna clase de perfección, que suele identificarse con la especie, e incluso la raza o la estirpe, del autor de la idea. Por fortuna, este punto de vista teleológico está en decadencia, y hoy es posible contemplar la evolución más como un proceso que como un medio para alcanzar algún fin.

Aun así, todavía persiste, incluso entre algunos biólogos, la idea de que es inherente a la evolución biológica cierta «tendencia» hacia la complejidad. Como hemos visto, lo que realmente ocurre es algo más sutil. La evolución procede por pasos, y en cada paso la complejidad puede aumentar o disminuir, pero el efecto en la totalidad de especies existentes es que la mayor complejidad representada tiende a aumentar con el tiempo. Un proceso similar se da en las comunidades en crecimiento económico, donde una familia concreta puede ver cómo sus ingresos aumentan, disminuyen o no varían, pero la distribución de ingresos se va ampliando, de modo que los ingresos familiares máximos en el conjunto de la comunidad tienden a incrementarse.

018.jpg
Figura 18. Distribución cambiante de las distancias en un paseo aleatorio

Si ignorásemos cualquier ventaja atribuible a una complejidad incrementada, podríamos contemplar la distribución cambiante de complejidades como una especie de difusión, ejemplificada por un «paseo aleatorio» a lo largo de una línea. Un gran número de pulgas parten de un mismo punto y van dando saltos iguales en longitud, alejándose del punto de partida o acercándose a él al azar (en el primer salto, por supuesto, todas se alejan). En cualquier momento posterior, una o más pulgas estarán más lejos que las demás del punto de partida. Naturalmente, la pulga más distante en cada caso puede variar, dependiendo de cuál de ellas ha dado, por azar, el mayor número de saltos netos alejándose del punto de partida. La distancia máxima del conjunto de pulgas tiende a aumentar con el tiempo. La distribución de distancias desde el punto de partida se amplía a medida que la difusión de las pulgas las lleva cada vez más lejos, como se muestra en la Figura 18.

El crecimiento de la complejidad máxima puede proceder, especialmente en sistemas no adaptativos como las galaxias, de una manera que recuerda a la difusión. Pero en los sistemas complejos adaptativos, como la evolución biológica, suele ocurrir que las presiones selectivas favorecen una mayor complejidad en determinadas situaciones. La forma de la distribución de complejidades en función del tiempo diferirá en tales casos de la que resulta de un paseo aleatorio. Aunque sigue sin haber razón alguna para pensar en una progresión continua hacia organismos cada vez más complejos, las presiones selectivas que favorecen una complejidad más alta a menudo pueden ser intensas. La caracterización de aquellos sistemas y entornos físicos en los que la complejidad es una gran ventaja representa un desafío intelectual importante.

Los sucesos umbral que se presentan en el transcurso de la evolución biológica suelen dar lugar a grandes incrementos de complejidad y también a progresos muy significativos. La apertura de un umbral crítico se traduce en una explosión de nuevos nichos ecológicos, cuya ocupación puede muy bien parecer causada por una tendencia hacia una mayor complejidad.

Dado que nosotros los humanos somos los organismos más complejos en la historia de la Tierra, es comprensible que algunos contemplen la totalidad del proceso evolutivo como algo conducente al Homo sapiens sapiens. Aun reconociendo que esta idea responde únicamente a un necio antropocentrismo, en cierto sentido sí puede decirse que la evolución biológica termina con nosotros, o por lo menos queda en suspenso. Nuestro efecto sobre la biosfera es tan profundo y nuestra capacidad para transformar la vida (no sólo mediante procedimientos antiguos y lentos como los de los criadores de perros, sino con métodos modernos como la ingeniería genética) será pronto tan grande que ciertamente el futuro de la vida sobre la Tierra depende en gran parte de decisiones cruciales tomadas por nuestra propia especie. Salvo una espectacular renuncia a la tecnología (muy difícil a la vista de la enorme población humana que depende ya completamente de ella para su sustento) o la autodestrucción de la mayor parte del género humano —seguida de una regresión a la barbarie de los supervivientes— da la impresión de que, en un futuro previsible, el papel de la evolución biológica natural será, para bien o para mal, secundario al de la cultura humana y su evolución.

La diversidad de las comunidades ecológicas

Desafortunadamente, pasará mucho tiempo antes de que el conocimiento, la inteligencia y el ingenio humanos puedan igualar —si es que lo hacen alguna vez— la «sabiduría» de miles de millones de años de evolución biológica. No sólo los organismos individuales han desarrollado morfologías intrincadas y modos de vida propios, sino que las interacciones entre la multiplicidad de especies que componen las comunidades ecológicas han experimentado delicados ajustes mutuos a lo largo de grandes periodos de tiempo.

Las diversas comunidades consisten en grupos de especies que difieren en función de la región del globo donde se encuentran y, dentro de cada región, del entorno físico. En tierra, el carácter de la comunidad varía de acuerdo con factores tales como la altitud, las lluvias y su distribución a lo largo del año, o la temperatura y sus variaciones. Las diferencias regionales se deben a que en muchos casos las distribuciones de las distintas especies se han visto afectadas por los movimientos de los continentes a lo largo de millones de años y accidentes tales como antiguas migraciones y dispersiones.

Los bosques tienden a diferir grandemente entre sí, incluso en los trópicos. No todos los bosques tropicales son pluvisilvas, como ciertos medios de comunicación podrían hacernos creer. Algunos son bosques secos, otros bosques de tipo alpino, etc. Por otra parte, pueden distinguirse cientos de pluvisilvas distintas, con diferencias significativas en la flora y en la fauna. Brasil, por ejemplo, alberga no sólo la vasta extensión de la selva amazónica, considerablemente variada en sí misma, sino también la muy diferente selva atlántica, ahora reducida a una pequeña fracción de su extensión inicial. En su margen meridional la selva atlántica se confunde con la del Alto Paraná en Paraguay y con la selva tropical de la provincia de Misiones en Argentina. La destrucción progresiva de la selva amazónica es ahora una preocupación general, aunque todavía se mantiene en pie gran parte de ella (a veces, por desgracia, en un estado degradado no detectable fácilmente desde el aire), pero la preservación de lo que queda de la selva atlántica es un asunto aún más urgente.

También los desiertos difieren entre sí. En el desierto del Namib, en Namibia, la flora y la fauna son en gran parte diferentes de las del desierto del Sahara, en el otro extremo de África, y de las del desierto espinoso del sur de Madagascar. Los desiertos de Mojave y del Colorado, en el sur de California, son bien distintos entre sí y comparten pocas especies con, digamos, el Negev israelí (una excepción notable es el sabra, el conocido cactus de Israel, que es una especie originaria de México y California). En una visita a los desiertos del Colorado y del Negev, una inspección superficial revelará muchas semejanzas en la apariencia de la flora, pero buena parte de este parecido es atribuible, no a un parentesco cercano entre las especies, sino a una convergencia evolutiva resultante de presiones selectivas similares. Igualmente, muchas euforbias de las mesetas áridas de África oriental se parecen a los cactus del Nuevo Mundo, pero sólo porque se han adaptado a climas similares; en realidad pertenecen a familias diferentes. La evolución ha producido en diversas partes del globo cierto número de soluciones distintas pero similares al problema representado por una comunidad de organismos viviendo en unas condiciones determinadas.

Ante tal diversidad de comunidades naturales ¿tendrán los seres humanos la sabiduría colectiva necesaria para elegir las políticas apropiadas? ¿Habremos adquirido el poder de efectuar cambios enormes antes de haber madurado lo suficiente como especie para hacer un uso responsable del mismo?

El concepto biológico de adaptación

Las comunidades ecológicas compuestas de multitud de individuos complejos pertenecientes a gran número de especies, todos ellos desarrollando esquemas para describir y predecir el comportamiento mutuo, son sistemas que probablemente nunca alcanzan un estado estacionario final y ni siquiera se aproximan a él. Cada especie evoluciona en presencia de agrupaciones constantemente cambiantes de otras especies. La situación es muy diferente de la de los extremófilos oceánicos, que evolucionan en un entorno fisicoquímico prácticamente constante e interaccionan con otros organismos principalmente a través de la materia orgánica que desciende hasta ellos a través del agua.

Ni siquiera a un sistema comparativamente simple y casi autocontenido como el de los extremófilos se le puede asignar un atributo numérico rigurosamente definido que se llame «adaptación», y mucho menos que vaya aumentando en el curso de la evolución hasta llegar a un estado estacionario. Incluso en un caso tan simple es más seguro concentrarse directamente en las presiones selectivas que favorecen unos caracteres fenotípicos sobre otros, influyendo así en la competencia entre los diferentes genotipos. Estas presiones selectivas pueden no ser expresables en términos de una magnitud simple y bien definida llamada adaptación, sino que pueden requerir una descripción más complicada, incluso en el caso ideal de una sola especie que se adapta a un medio ambiente inmutable. Todavía es menos probable, pues, que pueda asignarse una medida de adaptación a un organismo en un entorno cambiante, especialmente cuando se trata de un miembro de una comunidad ecológica de organismos altamente interactivos adaptándose a las peculiaridades de unos y otros.

Aún así, un tratamiento simplificado de la evolución biológica en términos de adaptación puede resultar instructivo. La idea subyacente al concepto de adaptación biológica es que la propagación de los genes de una generación a la siguiente depende de la supervivencia del organismo hasta que éste alcanza la fase reproductora y genera un número razonable de descendientes que a su vez sobreviven para reproducirse. Las tasas diferenciales de supervivencia y reproducción pueden describirse a menudo toscamente en términos de un índice de adaptación, definido de manera que los organismos con una mayor adaptación tienden en general a propagar sus genes con más éxito que los que tienen una adaptación menor. En el límite, los organismos con patrones genéticos asociados consistentemente con el fracaso reproductivo tienen una adaptación muy baja y tienden a desaparecer.

Relieves adaptativos

Al introducir la tosca noción de «relieve adaptativo» se pone de manifiesto una dificultad general. Imaginemos los diferentes genotipos dispuestos en una superficie bidimensional horizontal (que representa lo que en realidad es un espacio matemático multidimensional de genotipos posibles). La adaptación o inadaptación queda indicada por la altura; a medida que los genotipos varían la adaptación describe una superficie bidimensional, con gran número de crestas y valles, dentro de un espacio de tres dimensiones. Los biólogos representan convencionalmente el incremento de la adaptación como un incremento de altura, de modo que los máximos de adaptación corresponden a las cimas y los mínimos al fondo de los valles; pero yo emplearé la convención inversa, como se acostumbra a hacer en muchos otros campos, y daré la vuelta a todo el cuadro. Ahora la adaptación aumenta con la profundidad, y los máximos se encuentran en el fondo de las depresiones, como se muestra en la Figura 19.

El paisaje que resulta es muy complicado, con numerosos valles («máximos de adaptación locales») de profundidad muy variable. Si la evolución tuviese siempre como efecto un descenso continuo —una mejora constante de la adaptación— entonces el genotipo quedaría probablemente atrapado en el fondo de una depresión somera y no tendría oportunidad de alcanzar los valles profundos cercanos que corresponden a una adaptación mucho mayor. El movimiento del genotipo tiene que ser, como mínimo, más complicado que un simple deslizamiento hacia abajo. Si además incluyese, por ejemplo, saltos aleatorios, esto le daría la oportunidad de escapar de las depresiones someras y encontrar otras más profundas en las cercanías. Sin embargo, no debe haber demasiados saltos, o todo el proceso dejaría de funcionar. Como hemos visto en diversos contextos, un sistema complejo adaptativo funciona mejor en una situación intermedia entre el orden y el desorden.

019.jpg
Figura 19. Un relieve adaptativo en el que la adaptación crece con la profundidad

Adaptación inclusiva

Una complicación adicional en el manejo del concepto de adaptación surge en los organismos superiores que se reproducen sexualmente. Cada uno de tales organismos transfiere sólo la mitad de sus genes a la descendencia, mientras que la otra mitad procede del otro progenitor. Los descendientes no son clones, sino meros parientes cercanos. Y el organismo considerado tiene también parientes cercanos, la supervivencia de los cuales puede contribuir de alguna manera a la propagación de genes similares a los suyos. Para tener en cuenta hasta qué punto sobreviven y consiguen reproducirse los parientes de un organismo dado, de acuerdo con la cercanía del parentesco, los biólogos han desarrollado la noción de «adaptación inclusiva» (naturalmente, la adaptación inclusiva también tiene en cuenta la supervivencia del organismo mismo). La evolución debería mostrar una tendencia general a favorecer los genotipos que exhiban una alta adaptación inclusiva, especialmente a través de pautas de comportamiento heredadas que promuevan la supervivencia tanto del organismo individual como de sus parientes cercanos. Esta tendencia recibe el nombre de «selección de parentesco», y encaja bien en un cuadro evolutivo en el que los organismos serían meros instrumentos de los que los genes «se sirven» para propagarse. Este punto de vista ha sido popularizado como el del «gen egoísta».

El gen egoísta y el «gen literalmente egoísta»

Una forma extrema de gen egoísta podría ser responsable del fenómeno conocido como «distorsión segregacional». Descrita por el sociobiólogo Robert Trivers, la distorsión segregacional resultaría de la operación de un «gen literalmente egoísta», es decir, un gen que actúa directamente, no a través del organismo resultante, para triunfar en la competencia con los patrones genéticos rivales. Uno de tales genes presente en un animal macho podría hacer que sus espermatozoides adelantasen o incluso envenenasen a los de otros machos, haciendo así más fácil la victoria en la carrera para fecundar los huevos de la hembra. En cambio, un gen literalmente egoísta no tiene por qué conferir ninguna ventaja al organismo resultante, e incluso podría ser nocivo en cierto grado.

Aparte de estas notables excepciones, las presiones selectivas se ejercen indirectamente a través del organismo producido por la fusión de espermatozoide y óvulo. Esto está más en línea con la noción de sistema complejo adaptativo, donde el esquema (en este caso el genoma) se pone a prueba en el mundo real (por medio del fenotipo) y no directamente.

Adaptación individual e inclusiva

Un caso fascinante en el que parecen estar implicadas tanto la adaptación individual como la inclusiva es el denominado comportamiento altruista en ciertas especies de aves. El arrendajo mejicano vive en los hábitats áridos del norte de México, sureste de Arizona y suroeste de Nuevo México. Hace años los ornitólogos observaron que cada nido de esta especie era atendido a menudo por varias aves además de la pareja que produjo los huevos. ¿Qué hacían allá los otros arrendajos? El comportamiento que exhibían ¿era en verdad altruista? La investigación de Jerram Brown reveló que en muchos casos los ayudantes eran ellos mismos hijos de la pareja que criaba, y por lo tanto estaban ayudando a criar a sus propios hermanos. Este comportamiento parecía suministrar un notable ejemplo de evolución del comportamiento social a través de la adaptación inclusiva. La evolución había favorecido un comportamiento paternal en el que los arrendajos jóvenes, posponiendo su propia reproducción, ayudaban a alimentar y cuidar a sus hermanos menores, asistiendo así a la propagación de genes estrechamente relacionados con los propios.

Más recientemente, el cuadro se ha complicado algo a raíz de los trabajos de John Fitzpatrick y Glen Woolfenden acerca de una especie emparentada, el arrendajo de Florida, que habita en los robledales áridos —en franca recesión— del sur de aquella región. Hasta ahora esta ave se consideraba una de las muchas subespecies del arrendajo azul americano, muy común en el sudoeste de los Estados Unidos, pero Fitzpatrick y Woolfenden proponen que debe considerarse una especie separada, atendiendo a su apariencia, vocalizaciones, comportamiento y genética. Como en el arrendajo mejicano, el comportamiento de esta especie incluye la crianza asistida. Aquí también los ayudantes tienden a ser hijos de la pareja que cría, pero las observaciones de los investigadores de

Florida indican que los ayudantes actúan también en interés propio. Los territorios de anidamiento en el robledal árido son extensos (del orden de treinta acres) y son defendidos con fiereza, por lo que no resultan fáciles de conseguir. Los ayudantes están en la mejor posición para heredar todo o parte del territorio donde desempeñan su labor. Por lo menos en Florida, parece que la adaptación individual ordinaria tiene un papel muy importante en el comportamiento «altruista» del arrendajo.

No he presentado la historia del arrendajo de Florida para tomar partido en una controversia entre ornitólogos, sino para ilustrar la sutileza del concepto de adaptación, inclusiva o no. Aunque es un concepto útil, sigue siendo un tanto circular. La evolución favorece la supervivencia de los mejor adaptados, y los mejor adaptados son los que sobreviven, o aquellos cuyos parientes próximos sobreviven.

La adaptación sexual

El fenómeno de la reproducción sexual plantea algunos retos especiales a las teorías basadas en las presiones selectivas y la adaptación. Como muchos otros organismos, los animales superiores tienden a reproducirse sexualmente. Pero en ciertos casos esos mismos animales pueden reproducirse facultativamente por partenogénesis, un proceso en el que las hembras, sin requerir los servicios de un macho, generan hembras hijas que, aparte de posibles mutaciones, son genéticamente idénticas a las progenitoras. Incluso los huevos de un animal tan complejo como la rana pueden producir, tras ser estimulados con la punta de una aguja, renacuajos que se desarrollan hasta convertirse en ranas adultas. En algunos casos raros, como el de los lagartos de cola de látigo de México y el sudoeste de los Estados Unidos, una especie de vertebrado parece arreglárselas sólo con la partenogénesis, sin que haya machos en absoluto. ¿Para qué el sexo entonces? ¿Qué enorme ventaja confiere la reproducción sexual? ¿Por qué se selecciona en general frente a la partenogénesis? ¿Para qué sirven en verdad los machos?

La reproducción sexual introduce diversidad en los genotipos de los descendientes. A grandes rasgos, los cromosomas (cada uno con una cadena de genes) se presentan en pares, y cada individuo hereda uno de los componentes de cada par del padre y el otro de la madre. Cuál de ellos procede del padre y cuál de la madre es fundamentalmente una cuestión de azar. (En los gemelos idénticos, el resultado de esta repartición estocástica es el mismo para ambos.) La descendencia de los organismos con muchos pares de cromosomas tiene por lo general juegos de cromosomas diferentes de los de los progenitores.

Además de eso, la reproducción sexual introduce un mecanismo completamente nuevo, distinto de la mutación ordinaria, para producir cambios en los cromosomas. En el proceso denominado «entrecruzamiento», ilustrado en la Figura 20, un par de cromosomas homólogos intercambian fragmentos durante la formación de un espermatozoide o un huevo. Supongamos que el entrecruzamiento tiene lugar en el segundo caso. El huevo, producido por la madre, adquiere un cromosoma mixto, una parte del cual es aportada por el padre de la madre y el resto por la madre de la madre, mientras que otro huevo puede recibir un cromosoma formado por las partes restantes de los cromosomas del abuelo y la abuela matemos.

El teórico evolucionista William Hamilton, ahora catedrático en Oxford, ha sugerido una explicación simple para el valor de la reproducción sexual. En términos generales, la idea es que para los enemigos de una especie, especialmente los parásitos nocivos, resulta más difícil adaptarse a la diversidad de una población generada por reproducción sexual que a la relativa uniformidad de una población generada por partenogénesis. La mezcla de los cromosomas aportados por el padre y la madre, junto con el entrecruzamiento, permiten todo tipo de combinaciones nuevas entre los descendientes, obligando a los parásitos a enfrentarse a una gran variedad de huéspedes diferentes en su química corporal, hábitos, etc. El resultado es que los enemigos encuentran dificultades y los huéspedes están más seguros.

La teoría indica que las especies sin reproducción sexual deberían disponer de otros mecanismos para enfrentarse a los parásitos, especialmente en el caso de grupos enteros de animales inferiores que han vivido sin sexo durante decenas de millones de años. Los rotíferos bdeloideos son uno de tales grupos. Son animalillos que se desplazan girando y habitan en las alfombras de musgo y otros lugares que permanecen húmedos la mayor parte del tiempo, pero que se secan durante semanas o meses según los caprichos de la meteorología. Una discípula de Hamilton, Olivia Judson, está estudiando estos rotíferos para averiguar cómo se las arreglan con los parásitos. Ella sugiere que su hábito de desecarse y dejarse llevar por el viento cuando su entorno se seca podría proporcionarles la suficiente protección contra los parásitos como para prescindir del sexo.

En cualquier caso, las ventajas de la reproducción sexual tienen que ser considerables para compensar la desventaja obvia que supone la fragmentación de los genotipos de padres y abuelos con una capacidad demostrada para sobrevivir y reproducirse con éxito. Estas ventajas son relativas al conjunto de la población, aunque muchos evolucionistas insisten en que las presiones selectivas se ejercen únicamente sobre los individuos. Pero quizás ésta no sea una norma rígida.

En un reciente encuentro en el Instituto de Santa Fe, John Maynard Smith, que enseña en la Universidad de Sussex, comentaba este tema cuando Brian Arthur, presidente de la sesión, recordó la ocasión en que ambos se encontraron por primera vez. Los dos estudiaron la carrera de ingeniería. Maynard Smith comenzó diseñando aviones y después se pasó a la biología evolutiva, donde ha hecho importantes contribuciones. Brian, que se crió en Belfast, se dedicó a la investigación operativa y más tarde a la economía. Después se convertiría en profesor en Stanford y sería el director fundador del programa económico del Instituto de Santa Fe. Se encontraron por primera vez en un congreso científico en Suecia, donde en el curso de su intervención Maynard Smith hizo notar que mientras el sexo tenía ventajas obvias para las poblaciones, no estaba claro que las tuviera para los individuos. Brian gritó desde la audiencia: «¡Vaya visión del sexo más inglesa!». Maynard Smith, tras encajar el golpe, replicó: «Deduzco por su acento que usted es irlandés. Bien, en Inglaterra por lo menos tenemos sexo».

020.jpg
Figura 20. Entrecruzamiento de cromosomas en la reproducción sexual

Muerte, reproducción y población en biología

Mientras que el sexo no es algo ni mucho menos universal en biología, la muerte sí que está muy cerca de serlo. La muerte de los organismos es una de las más dramáticas manifestaciones de la segunda ley de la termodinámica. Y como tal es, en cierto sentido, común a todos los sistemas complejos adaptativos. Sin embargo, es especialmente significativa en la evolución biológica, donde la interacción entre muerte y reproducción está en la vanguardia del proceso adaptativo. La competencia entre grupos de genotipos se traduce en gran medida en la competencia por el tamaño de la población entre los tipos de organismos correspondientes. La adaptación, hasta donde puede hacerse una buena definición de ella en el contexto de la evolución biológica, está siempre conectada con el tamaño de la población.

La comparación entre diversas clases de sistema complejo adaptativo revela situaciones en que la muerte, la reproducción y la población tienen menos importancia que en biología. Por ejemplo, imaginemos un ser humano individual absorto en la resolución de un problema. En este caso los esquemas son ideas y no genotipos. El análogo de la muerte es el olvido. Nadie puede negar la omnipresencia y significación del olvido, pero difícilmente puede compararse su papel con el de la muerte en biología. Si no fuese necesario olvidar, «borrar la cinta», el carácter del pensamiento no experimentaría grandes cambios. El recuerdo de una idea es útil, y contrarresta el efecto del olvido, pero el número de recuerdos idénticos o casi idénticos no caracteriza la adecuación de una idea en la misma medida que la población tiende a correlacionarse con la adaptación en biología.

A medida que las ideas se propagan en el seno de una sociedad (también en la comunidad científica) adquiere importancia el número de personas que comparten una idea determinada. En las elecciones democráticas, en la medida en que tienen que ver con las ideas, la opinión mayoritaria es la que prevalece. Pero está claro que la existencia de un abrumador número de partidarios no necesariamente implica que una idea sea correcta, y ni siquiera garantiza su supervivencia a largo plazo.

Un ejemplo más cercano a la evolución biológica puede ser el de la competencia entre las sociedades humanas en el pasado. En gran medida, la adaptación se medía por la población. En el Sudeste Asiático, por ejemplo, algunos grupos étnicos practicaban la agricultura de regadío para el cultivo del arroz, mientras que otros practicaban una agricultura de secano, a menudo quemando el bosque. Los primeros, como los pueblos de Tailandia central, Laos o Vietnam, podían mantener muchos más individuos por unidad de superficie que sus vecinos. La mayor densidad de población les permitió dominar a los agricultores de secano, que en muchos casos se vieron relegados a tierras montañosas remotas. De cara al futuro, bien podemos preguntarnos si es deseable que la densidad o la población absoluta continúen determinando de la misma manera quiénes ganan y quiénes pierden.

La ocupación de los nichos

A largo plazo, la evolución biológica, con su énfasis en la muerte y la población, es perfectamente eficiente en la ocupación de nuevos nichos ecológicos a medida que éstos surgen. Cuando existe la oportunidad de adoptar un cierto modo de vida, es probable que algún organismo evolucione para aprovecharla, por estrafalario que pueda parecer a los ojos de un observador humano.

En este contexto es relevante la analogía entre una comunidad ecológica y la economía de mercado. Cuando surgen nuevas oportunidades para hacer negocio en una economía de este tipo, lo más probable (aunque no es seguro) es que aparezcan individuos o empresas dispuestos a explotarlas. La analogía de la muerte en este caso es la quiebra, y es la riqueza, en vez de la población,

lo que da una medida aproximada de la adaptación de la empresa.

Tanto en economía como en ecología, la aparición de un nuevo negocio o un nuevo organismo (o de una nueva forma de actuar en una empresa u organismo ya existente) altera el relieve adaptativo de los otros miembros de la comunidad. Desde el punto de vista del negocio o de la especie, este relieve experimenta continuos cambios (además de no estar del todo bien definido a priori).

Ambos casos ilustran cómo un sistema complejo adaptativo, una vez establecido, puede llenar nichos, crear otros nuevos en el proceso, llenar éstos a su vez y así sucesivamente, engendrando nuevos sistemas complejos adaptativos por el camino. (Como se indicaba en el diagrama de la Figura 1, la evolución biológica ha dado lugar al sistema inmunitario de los mamíferos, al aprendizaje y al pensamiento y, a través de los seres humanos, a sociedades capaces de aprender y adaptarse, y más recientemente a ordenadores que funcionan como sistemas complejos adaptativos.)

Siempre explorando, buscando nuevas oportunidades, experimentando con la novedad, el sistema complejo adaptativo ensaya incrementos de complejidad y ocasionalmente descubre sucesos umbral que abren posibilidades estructurales completamente nuevas, incluyendo nuevas formas de sistema complejo adaptativo. Dado un tiempo suficiente, la probabilidad de la evolución de la inteligencia parece que debiera ser alta.

Astrónomos y planetólogos piensan que no existe ninguna razón para pensar que los sistemas planetarios sean especialmente raros en nuestra galaxia o en cualquier otra galaxia similar en el universo. Tampoco los teóricos del origen de la vida tienen motivos para pensar que las condiciones de nuestro planeta hace unos 4000 millones de años fueran tan especiales que la aparición de la vida (o algo parecido a ella) en un planeta sea un acontecimiento particularmente improbable. Es verosímil que en el universo abunden los sistemas complejos adaptativos y que en muchos de ellos haya evolucionado, o acabe por evolucionar, la inteligencia. Como ya hemos mencionado, para la búsqueda de inteligencia extraterrestre el principal dato que falta es el número de planetas por unidad de volumen espacial en los que han surgido seres inteligentes y la duración típica del período de civilización técnica con emisión de señales electromagnéticas. Dada la inmensa cantidad de conocimiento que podemos extraer de la diversidad de comunidades naturales en la Tierra, por no hablar de la diversidad de sociedades humanas, resulta sobrecogedor imaginar (como hacen a veces los escritores de ciencia ficción) las lecciones que el contacto con extraterrestres podría damos acerca de la variedad de circunstancias que los sistemas complejos adaptativos son capaces de explotar.

El engaño entre las aves

Para encontrar ejemplos curiosos de explotación de oportunidades por parte de especies en interacción con otras, podemos fijamos en el engaño tal como es practicado por animales no humanos. El mimetismo es bien conocido; la mariposa virrey, por ejemplo, se parece a la monarca y se aprovecha así del rechazo que inspira ésta en los depredadores a causa de su mal sabor. El cuclillo (en el Viejo Mundo) y el boyero (en el Nuevo Mundo) practican otro tipo de engaño, poniendo sus huevos en los nidos de otras aves; los polluelos intrusos se deshacen después de los huevos o polluelos legítimos y monopolizan la atención de los padres adoptivos. Ahora bien, ¿realmente engañan?

Estamos acostumbrados a oír que la gente engaña, pero que esto ocurra en otros organismos resulta más sorprendente. Cuando la marina argentina descubre un misterioso periscopio en el estuario del Río de la Plata justo antes de que el presupuesto de las fuerzas armadas comience a debatirse, podemos sospechar que se está intentando engañar para conseguir recursos adicionales, lo que no nos resulta especialmente sorprendente. Pero la existencia de un comportamiento análogo entre las aves es algo inesperado.

Un caso así fue descubierto recientemente por mi amigo Charles Munn, un ornitólogo que estudia las bandadas mixtas que se alimentan en las selvas bajas tropicales del Parque Nacional Manu, en Perú. Algunas especies ramonean juntas en el sotobosque y otras en el estrato inferior del dosel, acompañadas de vez en cuando por coloreados tangarás frugívoros procedentes del estrato superior. (Entre las especies presentes en estas bandadas en la época invernal hay unos pocos migradores norteamericanos. Más al norte, hacia Centroamérica, se encuentran muchos más. Quienes residimos en Norteamérica sólo las vemos cuando anidan en verano, y nos llama la atención encontrarlas llevando un modo de vida muy diferente en tierras lejanas. Si queremos que vuelvan para anidar año tras año, hay que proteger sus hábitats en los países meridionales. Igualmente, su retorno a estos países quedará comprometido si los bosques norteamericanos continúan siendo reducidos a parcelas cada vez más pequeñas. La reducción de los bosques propicia invasiones posteriores por parte de los boyeros parásitos.)

En cada bandada mixta hay una o dos especies centinela que deambulan de manera que suelen estar en medio de la bandada o justo debajo. Mediante un canto especial los centinelas advierten a los demás de la presencia en las proximidades de posibles aves rapaces. Charlie observó que los centinelas de las bandadas del sotobosque daban a veces la señal de aviso aun cuando no existía un peligro aparente. Una inspección más cercana demostraba que la falsa alarma permitía a menudo al centinela arrebatar un suculento bocado que de otro modo se habría comido otro miembro de la bandada. Una observación cuidadosa reveló que los centinelas practicaban el engaño alrededor de un 15% de las veces, sacando provecho de él con frecuencia. Preguntándose si este fenómeno sería más general, Charlie examinó el comportamiento de las bandadas del estrato inferior del dosel y encontró que los centinelas de allá hacían lo mismo. El porcentaje de señales falsas era más o menos el mismo en las dos especies centinela. Presumiblemente, si este porcentaje fuera mucho mayor las señales dejarían de ser aceptadas por el resto de la bandada (recuérdese el cuento del pastorcillo que gritaba «¡que viene el lobo!») y si fuera mucho menor, el centinela apenas obtendría alimento extra. Me pregunto si este dato del 15% podría derivarse de alguna clase de razonamiento matemático; en un modelo plausible, ¿podría corresponder a 1/2n?

Cuando consulté esta cuestión con Charles Bennett, recordó algo que le había contado su padre sobre las unidades de la fuerza aérea canadiense con base en Inglaterra durante la segunda guerra mundial. Para las ocasiones en que enviaban un caza y un bombardero juntos, les pareció una buena idea intentar engañar de vez en cuando a la Luftwaffe haciendo volar el caza por debajo del bombardero y no por encima como era lo habitual. Tras aplicar el método de ensayo y error un buen número de veces, llegaron a la conclusión de que lo mejor era hacerlo al azar una vez de cada siete.

Pequeños pasos y grandes cambios

En nuestra discusión de los sucesos umbral citábamos algunos ejemplos de avances en la evolución biológica que representaban saltos enormes, pero también indicábamos que se trata de acontecimientos raros en el extremo de todo un espectro de cambios de magnitud diversa, siendo mucho más comunes los cambios pequeños cerca del otro extremo del espectro. Sea cual sea la magnitud del evento, la evolución biológica suele proceder actuando sobre lo que hay disponible. Los órganos existentes se adaptan a nuevos usos. Los brazos humanos, por ejemplo, no son más que patas anteriores ligeramente modificadas. Las estructuras no son radicalmente descartadas en un rediseño revolucionario de la totalidad del organismo. Los mecanismos de la mutación y la selección natural no favorecen tales discontinuidades. Pero las revoluciones ocurren.

Hemos discutido cómo, en el fenómeno del «equilibrio puntuado», los cambios relativamente repentinos pueden tener orígenes diversos. Uno de los posibles es un cambio en el entorno fisicoquímico que altere significativamente las presiones selectivas. Otro es la «deriva», en la que las mutaciones neutras, que no alteran la viabilidad del fenotipo (y a veces ni siquiera éste) conducen gradualmente a una situación de inestabilidad del genotipo, donde una o unas pocas mutaciones pueden crear un organismo significativamente diferente y preparar el camino para una cascada de cambios que se extiendan a otras especies. A veces pequeños cambios desencadenan sucesos umbral, muchas veces de carácter bioquímico, que abren dominios enteros de formas de vida completamente nuevas. En algunos casos estos cambios revolucionarios se inician con la agregación de organismos en estructuras compuestas. Pero en todos los casos la unidad básica de cambio es una mutación (o recombinación, con o sin entrecruzamiento) que opera sobre lo que ya está presente. Nunca se saca nada de donde no hay.

¿Hasta qué punto es éste un principio general para los sistemas complejos adaptativos? En el pensamiento humano, por ejemplo, ¿es necesario proceder por pequeños pasos? ¿Debe limitarse el proceso de creación a encadenamientos de cambios menores sobre lo ya existente? ¿Por qué no podría un ser humano ser capaz de inventar un ingenio totalmente nuevo, diferente de cualquier otro conocido? Y en ciencia, ¿por qué no concebir una teoría completamente nueva, sin ninguna semejanza con las ideas precedentes?

La investigación (y también la experiencia diaria) parece indicar que, efectivamente, el pensamiento humano suele proceder por asociación y por pasos, en cada uno de los cuales se introducen modificaciones específicas sobre lo pensado con anterioridad. Pero tanto en la invención como en la ciencia, el arte, y muchos otros campos de la creación humana, de vez en cuando surgen estructuras singularmente novedosas. Tales innovaciones recuerdan los sucesos umbral en la evolución biológica. ¿Cómo se producen? ¿Responde el pensamiento creativo humano a modelos diferentes según las diferentes áreas de actividad? ¿O hay involucrados principios generales de alguna clase?

Capítulo 17
Del aprendizaje al pensamiento creativo

Comenzaremos con algunas observaciones sobre la creación en el marco de la teoría científica y después exploraremos su relación con la creación en otros campos.

Cuando una nueva idea teórica se impone acostumbra a alterar y ampliar el cuerpo de teoría existente, permitiendo acomodar hechos observacionales que antes no podían comprenderse o no encajaban. También predice nuevos hechos que algún día pueden ser comprobados.

Casi siempre, la idea novedosa incluye una autocrítica negativa, el reconocimiento de que algún principio previamente aceptado es falso y debe descartarse (a menudo ocurre que una idea que era correcta en principio iba acompañada, por razones históricas, de un lastre intelectual innecesario que hay que tirar por la borda.) En cualquier caso, sólo saliéndose del marco de ideas aceptadas excesivamente restrictivas puede haber progreso.

En ocasiones, cuando una idea correcta es propuesta y aceptada por primera vez, se le da una interpretación demasiado estrecha. En cierto sentido, sus posibles implicaciones no se toman lo bastante en serio. Más adelante el autor de la idea original o algún otro teórico vuelven sobre ella para examinarla con más rigor, de modo que pueda apreciarse todo su significado.

El primer artículo de Einstein sobre la relatividad especial, que publicó en 1905 a la edad de 26 años, ilustra tanto el rechazo de una idea aceptada equivocada como la reconsideración de una idea correcta no aplicada en toda su extensión. Einstein tuvo que romper con la idea, aceptada pero errónea, de un espacio y un tiempo absolutos. Después comenzó a considerar la idea de que las simetrías presentes en las ecuaciones de Maxwell para el electromagnetismo —las simetrías correspondientes a la relatividad especial— tuviesen carácter de principio general. Hasta entonces su dominio de aplicación se había restringido al electromagnetismo, y no se pensaba que pudiesen regir, por ejemplo, en la dinámica de partículas.

Una experiencia personal

A lo largo de mi carrera he tenido el placer y la fortuna de proponer unas cuantas ideas dentro del campo de la teoría de partículas elementales que, por supuesto, no me colocan a la altura de un Einstein, pero sí que han resultado ser útiles e interesantes y me han proporcionado alguna experiencia personal acerca del acto creativo en el marco de la teoría científica.

Una de mis primeras aportaciones servirá de ilustración. En 1952, cuando ingresé en la facultad de física de la Universidad de Chicago, me propuse encontrar una explicación al comportamiento de las nuevas «partículas extrañas», así llamadas porque se producían en abundancia como correspondería a una interacción fuerte, pero se desintegraban lentamente, una propiedad asociada a la interacción débil. (Aquí «lentamente» significa una vida media de alrededor de una diez mil millonésima de segundo; la tasa normal de desintegración para la interacción fuerte correspondería a una vida media de alrededor de una billonésima de billonésima de segundo, más o menos el tiempo que tarda la luz en atravesar una partícula semejante.)

Para explicar este comportamiento conjeturé la existencia de alguna ley que impidiese la desintegración inducida por la interacción fuerte, responsable de la abundante producción de partículas extrañas. La desintegración procedería entonces lentamente a través de una interacción débil. Ahora bien, ¿qué ley era ésta? Los físicos especulaban desde hace tiempo sobre la conservación en la interacción fuerte de la magnitud conocida como espín isotópico (I), que puede tomar los valores 0, 1/2, 1, 3/2, 2, 5/2, etc. Por aquellas fechas un grupo de físicos que trabajaba en el piso de abajo, bajo la batuta de Enrico Fermi, estaba comenzando a reunir pruebas experimentales en favor de esta idea, por lo que decidí comprobar si la conservación del espín isotópico podía ser la ley en cuestión.

La hipótesis convencional era que los fermiones —partículas nucleares (asociadas a la interacción fuerte) como el neutrón y el protón— deberían caracterizarse por valores de I iguales a 1/2, 3/2, 5/2, etc., siguiendo el ejemplo del neutrón y el protón, que tienen un valor I = 1/2 (la idea estaba reforzada por el hecho de que el momento angular de espín de un fermión sólo puede tomar los valores indicados). Asimismo se creía que las partículas bosónicas asociadas a la interacción fuerte, los mesones, deberían tener I = 0, 1,2, etc., como el pión, que tiene I = 1 (otra vez el paralelismo con el momento angular de espín, que para un bosón debe ser un número entero, una creencia fuertemente consolidada en el marco de la teoría entonces aceptada).

Un grupo de partículas extrañas (ahora llamadas partículas sigma y lambda) consiste en fermiones asociados a la interacción fuerte que se desintegran lentamente en un pión (I = 1) más un neutrón o un protón (I = 1/2). En un principio pensé en asignar a estas partículas extrañas un espín isotópico de 5/2, lo que impediría la desintegración inducida por la interacción fuerte. Pero esto no servía, porque efectos electromagnéticos tales como la emisión de un fotón podrían cambiar I en una unidad y burlar así la ley. En estas fui invitado por el Instituto de Estudios Avanzados de Princeton a dar una charla sobre mi idea y sus limitaciones. En la discusión sobre las partículas sigma y lambda, iba a decir «supongamos que tienen I = 5/2, de modo que la interacción fuerte no puede inducir su desintegración» para después demostrar cómo el argumento se iba a pique por culpa del electromagnetismo, al cambiar I = 5/2 por I = 3/2, un valor que permitiría a la desintegración en cuestión proceder rápidamente a través de la interacción fuerte.

Por un desliz dije «I = 1» en vez de «I = 5/2». Inmediatamente me quedé parado al darme cuenta de que eso era precisamente lo que yo andaba buscando. El electromagnetismo no puede cambiar I = 1 en I = 3/2 o I = 1/2, por lo que el comportamiento de las partículas extrañas podía explicarse por la conservación de I después de todo.

Ahora bien, ¿y la regla que afirma que los fermiones asociados a la interacción fuerte debían tener valores de I sementeros como 1/2, 3/2 o 5/2? Enseguida caí en la cuenta de que esta regla era una mera superstición, un lastre intelectual innecesario superpuesto al concepto válido de espín isotópico, y que había llegado el momento de librarse de ella. El concepto de espín isotópico veía así ampliado su dominio de aplicación.

La explicación de la desintegración de las partículas extrañas surgida de aquel lapsus limpie demostró ser correcta. Hoy día tenemos una comprensión más profunda de ella y, en correspondencia, una manera más simple de exponerla: las partículas extrañas difieren de otras más familiares como los neutrones, protones o piones en que tienen al menos un quark «extraño», o quark s, en lugar de un quark u o un quark d. Sólo la interacción débil puede transformar el «sabor» de un quark en otro, y este proceso tiene lugar lentamente.

Experiencias compartidas sobre gestación de ideas creativas

Hacia 1970 formé parte de un pequeño grupo de físicos, biólogos, pintores y poetas reunidos en Aspen, Colorado, para debatir sobre la experiencia de la gestación de ideas creativas. Cada uno de nosotros describió un episodio referente a su propio trabajo. Yo elegí el del lapsus durante mi charla en Princeton.

Los relatos mostraban una notable concordancia. Todos habíamos encontrado una contradicción entre el modo establecido de hacer las cosas y algo que queríamos llevar a cabo: en el arte, la expresión de un sentimiento, un pensamiento, una intuición; en la teoría científica, la explicación de algunos hechos experimentales enfrentados a un «paradigma» aceptado que no permite tal explicación.

En primer lugar, habíamos trabajado durante días, semanas o meses, meditando sobre las dificultades del problema en cuestión e intentando solventarlas. En segundo lugar, había llegado un momento en que, aunque siguiéramos dándole vueltas al asunto, era inútil seguir pensando. En tercer lugar, de modo repentino, mientras paseábamos en bicicleta, nos afeitábamos o cocinábamos (o por una equivocación, como en el ejemplo descrito por mí) se presentaba la idea crucial. Habíamos conseguido salir del atolladero en que nos habíamos metido.

A todos nos llamó la atención la congruencia entre nuestras respectivas historias. Más adelante he sabido que esta percepción del acto creativo es de hecho bastante antigua. Hermann von Helmholtz, el gran fisiólogo y físico de finales del siglo pasado, describió las tres etapas de la gestación de una idea como saturación, incubación e iluminación, en perfecta concordancia con lo que los miembros del grupo de Aspen estuvimos discutiendo un siglo después.

Cabe preguntarse qué es lo que pasa durante la segunda etapa, la de incubación. Para quienes se inclinen por el psicoanálisis, una interpretación que acude de inmediato a la mente es que a lo largo del periodo de incubación, la actividad mental continúa, pero en el nivel «pre consciente», justo al borde de la conciencia. Mi propia experiencia, con el descubrimiento repentino de la solución correcta como consecuencia de un desliz, difícilmente puede ajustarse mejor a tal interpretación. Pero algunos psicólogos académicos escépticos ofrecen una hipótesis alternativa, la de que en realidad no ocurre nada durante la fase de incubación, excepto quizás un debilitamiento de la propia fe en el falso principio que entorpece la búsqueda de soluciones. El verdadero pensamiento creativo tendría lugar entonces justo antes del momento de la iluminación. En cualquier caso, entre la fase de saturación y la de iluminación siempre transcurre un intervalo de tiempo apreciable que puede considerarse como un periodo de incubación, tanto si pensamos intensamente sin ser conscientes de ello como si solamente algún prejuicio pierde gradualmente su capacidad para dificultar el hallazgo de una solución.

En 1908, Henri Poincaré añadió una cuarta etapa, importante aunque obvia: la verificación. Poincaré describe su propia experiencia en el desarrollo de una teoría para cierta clase de funciones matemáticas. Trabajó incansablemente en el problema durante dos meses sin éxito. Una noche de insomnio le pareció que «las ideas surgían en tropel; las sentía colisionar hasta que, por así decirlo, un par de ellas quedaban trabadas formando una combinación estable». Todavía no tenía la solución. Pero, un día después, estaba subiendo a un autobús que lo iba a transportar junto con varios colegas en una excursión geológica de campo cuando «... sin que nada en mis pensamientos pareciera haberle preparado el camino, me vino de pronto la idea de que las transformaciones que había empleado para definir estas funciones eran idénticas a las de la geometría no euclídea. No la verifiqué en ese momento, y cuando tomé asiento continué con una conversación iniciada antes, pero sentía una certeza absoluta. De vuelta a Caen, para tranquilizar mi conciencia, verifiqué el resultado».

El psicólogo Graham Wallis describió formalmente este proceso de cuatro etapas en 1926, y desde entonces ha sido un tema estándar dentro de la psicología aplicada, aunque pienso que ninguno de nosotros en la reunión de Aspen había oído hablar antes de él. Lo encontré por primera vez en el libro de Morton Huna The Universo Mitin (El universo interior), de donde he sacado las citas anteriores.

¿Puede acelerarse o eludirse la incubación?

Ahora bien, ¿es necesario pasar por un período de incubación? ¿Puede acelerarse o eludirse esta etapa de modo que no tengamos que esperar tanto para que acuda la nueva idea indispensable? ¿Podemos encontrar un atajo para salir del atolladero intelectual en el que estamos atrapados?

Hay gente que ofrece programas especiales para aprender determinadas técnicas mentales y que asegura que el pensamiento creativo puede desarrollarse con un adiestramiento adecuado. Algunas de sus sugerencias para salir del atolladero se ajustan bastante bien a una interpretación del proceso en términos de sistemas complejos adaptativos. El aprendizaje y el pensamiento en general ejemplifican el funcionamiento de los sistemas complejos adaptativos, y quizá la más alta expresión de esta facultad en la Tierra es el pensamiento creativo humano.

Un análisis aproximado en términos de relieves adaptativos

Como en cualquier otro análisis de sistemas complejos adaptativos, resulta instructivo introducir las nociones de adaptación y relieve adaptativo, aunque, todavía más que en el caso de la evolución biológica, no dejan de ser idealizaciones supersimplificadas. Es improbable que un conjunto de presiones selectivas sobre los procesos mentales pueda expresarse en términos de una adaptación bien definida.

Esto es especialmente cierto en la búsqueda de ideas creativas por parte de un artista. En ciencia el concepto probablemente puede aplicarse mejor: la adaptación o adecuación de una idea teórica sería una medida de hasta qué punto mejora la teoría existente, por ejemplo al explicar nuevas observaciones a la vez que mantiene o incrementa la coherencia y el poder explicativo de dicha teoría. En cualquier caso, imaginemos que tenemos un relieve adaptativo para las ideas creativas. Aquí también asociaremos una altura decreciente con una adaptación creciente (compárese con el diagrama de la Figura 19).

Como hemos visto en el caso de la evolución biológica, es demasiado simple suponer que un sistema complejo adaptativo únicamente se desliza pendiente abajo. Cuando cayese en una depresión, el sistema descendería uniformemente hasta llegar al fondo, un máximo local de adaptación. La región en forma de embudo que rodea a cada uno de estos máximos locales recibe el nombre de cuenca de atracción. Si el sistema no hiciera otra cosa que descender, está claro que sería muy probable que quedase atrapado en el fondo de una depresión poco profunda. A mayor escala hay más cuencas, algunas de las cuales pueden ser más profundas (y por lo tanto representar una mayor adaptación y ser más «deseables») que aquella en la que se encuentra el sistema, como se muestra en la Figura 19. ¿Cómo se las arregla el sistema para explorar estas otras cuencas?

Una manera de salir de una cuenca de atracción, como se discutía en el caso de la evolución biológica, tiene que ver con el ruido, entendido éste como un movimiento aleatorio superpuesto a la tendencia descendente. El ruido da al sistema la oportunidad de escapar de una depresión somera y encaminarse hacia alguna de las depresiones vecinas más profundas, hasta alcanzar el fondo de una depresión auténticamente profunda. Sin embargo, el ruido debe ser tal que las amplitudes de las excursiones aleatorias no sean demasiado grandes. De otro modo la interferencia con el proceso de descenso sería excesiva, y el sistema no permanecería en una cuenca profunda ni siquiera después de haberla alcanzado.

Otra posibilidad es que haya pausas en el proceso de descenso uniforme que permitan una exploración libre de las proximidades. Esto permitiría el descubrimiento de depresiones vecinas más profundas. Hasta cierto punto tales pausas se corresponden con el proceso de incubación en el pensamiento creativo, en el que la búsqueda metódica de la idea requerida queda en suspenso y la exploración puede continuar fuera de los límites del pensamiento consciente.

Algunas recetas para escapar hacia cuencas más profundas

Algunas de las sugerencias para acelerar el proceso de gestación de una idea creativa se ajustan bien al cuadro del uso de un nivel controlado de ruido para evitar quedarse en el fondo de una cuenca de atracción demasiado poco profunda. Se puede intentar escapar de la cuenca original por medio de una perturbación aleatoria —Edward DeBono, por ejemplo, recomienda intentar aplicar al problema, sea cual sea, el último sustantivo de la portada del diario.

Otro método, muy empleado a lo largo de la posguerra, es el llamado «de imaginación creativa». Aquí varias personas intentan encontrar soluciones a un problema reuniéndose para una discusión colectiva en la que se anima a una de ellas a desarrollar la sugerencia de alguna otra sin que esté permitido rechazarla por muy estrafalaria que sea. Una propuesta disparatada o autocontradictoria puede representar un estado mental inestable que conduzca a una solución. DeBono gusta de citar como ejemplo una discusión sobre el control de la contaminación fluvial, en la cual alguien podría decir: «Lo que de verdad hace falta es asegurarse de que las fábricas estén aguas abajo en relación a ellas mismas». Esta sugerencia es manifiestamente imposible, pero alguien más podría derivar de ella una propuesta más seria diciendo: «Se puede hacer algo parecido a eso colocando la toma de agua de cada fábrica aguas abajo en relación al desagüe». La idea disparatada puede contemplarse como una elevación dentro del relieve adaptativo que puede conducir a una cuenca mucho más profunda que la de partida.

¿Transferencia de técnicas mentales?

Edward y muchos otros han preparado material didáctico para cursos especiales de técnicas mentales para escolares, así como para empresas y hasta asociaciones de vecinos. Algunas de estas técnicas se refieren al logro de ideas creativas. Estos cursos han sido ensayados en diversas partes del mundo. En Venezuela, por ejemplo, uno de sus últimos presidentes creó un ministerio de inteligencia para fomentar la enseñanza de técnicas mentales en las escuelas de aquel país. Bajo los auspicios del nuevo ministerio un gran número de estudiantes ha seguido diversos cursos de este tipo.

Frecuentemente el contenido de los cursos destaca el uso de técnicas mentales en contextos particulares. Por ejemplo, muchos de los ejercicios de Edward tienen que ver con lo que yo llamaría análisis o estudios políticos. Se refieren a elecciones entre líneas de acción alternativas a escala de individuo, familia, organización, pueblo o ciudad, estado o provincia, nación o entidad supranacional (un ejercicio puede comenzar, por ejemplo, con la hipótesis de que una nueva ley ha sido aprobada, y seguir con una discusión sobre sus posibles consecuencias). Por regla general, los contenidos se refieren al hallazgo y análisis de argumentos a favor y en contra de diversas opciones conocidas y al descubrimiento de otras nuevas.

Una cuestión que surge de modo natural es hasta qué punto las técnicas aprendidas en un cierto contexto son transferibles a otros diferentes. Ejercitar la mente ideando nuevas opciones políticas (o sopesando los méritos relativos de las viejas) ¿sirve para descubrir ideas nuevas y aprovechables en una rama de la ciencia o para crear grandes obras de arte? ¿Sirve para que los escolares aprendan ciencias, matemáticas, historia o lengua? Es posible que algún día tengamos una respuesta clara a estas preguntas. Mientras tanto, sólo disponemos de una información muy preliminar.

Comprobación de la validez de diversos métodos propuestos

Cuando alguien sigue un curso de técnicas mentales, resulta especialmente dificultoso determinar si ha tenido lugar algún progreso en la capacidad creativa del estudiante. Idealmente se debería disponer de un test más o menos normalizado, de modo que las partes interesadas —padres, funcionarios de la enseñanza y del gobierno, y legisladores— pudiesen comprobar los resultados. ¿Pero cómo puede un test normalizado medir el pensamiento creativo? Los problemas de diseño proporcionan una respuesta parcial. Por ejemplo, me han contado que en Venezuela se les pidió en una ocasión a los estudiantes de técnicas mentales que diseñaran una mesa para un pequeño apartamento. Es concebible que las respuestas a problemas de este tipo, calificadas con arreglo a un sistema de puntuación imaginativo y cuidadosamente estudiado, puedan dar alguna indicación acerca de la asimilación de las técnicas creativas por parte de los estudiantes.

David Perkins, de la Harvard Graduate School of Education, uno de los proponentes del problema de la mesa, está especialmente interesado en infundir la enseñanza de técnicas mentales a la totalidad del programa educativo y no restringirla a cursos especiales. Destaca especialmente que la necesidad de ideas creativas no surge sólo en los dominios estratosféricos de la ciencia y el arte, sino también en la vida diaria. Cita el ejemplo de un amigo que, en una excursión donde nadie había pensado en traer un cuchillo, salvó la situación cortando el queso con una tarjeta de crédito.

David señala que la investigación ha identificado cierto número de rasgos propios de la gente que, en el dominio de las ideas, consigue repetidamente salir de una cuenca de atracción para llegar a otra más profunda. Estos rasgos incluyen la dedicación a la tarea, la conciencia de estar atrapado en una cuenca inadecuada, una cierta inclinación a balancearse en las fronteras entre cuencas y la capacidad de formular y resolver problemas. Parece improbable que para poseer estos rasgos uno tenga que nacer con ellos. Es muy posible que puedan inculcarse, pero no está nada claro que las escuelas actuales hagan una labor significativa en esa dirección. Por ejemplo, como hace notar David, las escuelas son prácticamente los únicos sitios donde uno acostumbra a encontrarse con problemas ya formulados.

021.jpg
Figura 21. Solución del problema de conectar nueve puntos con cuatro líneas rectas sin levantar el lápiz del papel

Formulación de problemas y límites verdaderos de un problema

La formulación de un problema tiene que ver con el descubrimiento de sus límites reales. Para ilustrar lo que quiero decir, tomaré prestados algunos ejemplos que mi amigo Paul MacCready, antiguo vecino y compañero de clase en Yale, suele emplear en sus conferencias como ilustración de soluciones originales a problemas (Paul es el inventor del avión a pedales, el avión de energía solar, el pterodáctilo artificial volador y otros ingenios de lo que él modestamente llama «la frontera trasera de la aerodinámica»). Aunque emplearé sus mismos ejemplos, la lección que extraeré será algo diferente.

Consideremos el famoso problema ilustrado en la Figura 21: «Conectar los nueve puntos trazando el menor número posible de líneas rectas sin levantar el lápiz del papel». Mucha gente asume que las líneas tienen que mantenerse dentro del cuadrado determinado por los puntos exteriores, aunque esta restricción no forma parte del enunciado del problema. De este modo se requieren cinco líneas para resolverlo. Si permitimos que las líneas se prolonguen por fuera del cuadrado, entonces bastan cuatro, como se muestra en la ilustración. Si este fuera un problema en el mundo real, un paso crucial en su formulación sería descubrir si hay alguna razón para confinar las líneas dentro del cuadrado. Esto forma parte de lo que yo llamo la determinación de los límites del problema.

Si el problema permite que las líneas se prolonguen por fuera del cuadrado, quizá permita también otras libertades. ¿Qué tal si rompemos el papel en trozos, lo redistribuimos de modo que los puntos queden en fila y dibujamos una línea recta por encima de ellos en un solo trazo? Varias ideas como ésta han sido recogidas por James L. Adams en su libro Conceptual Blockbusters (Rompecabezas conceptuales). La mejor estaba en una carta que le envió una jovencita, reproducida en la Figura 22. El punto clave es la última frase: «Nadie dijo que no se pudiera usar una línea gruesa». ¿Están prohibidas las líneas gruesas o no? ¿Cuáles son las reglas en el mundo real?

022.jpg
Figura 22. Carta de una niña de diez años dirigida al profesor Adams. (De Conceptual Blockbusting. A guide to Better Ideas, de James L. Adams, tercera edición, Addison-Wesley, Reading, Mass., pág. 31. Copyright 1974, 1976, 1979, 1986 by James L. Adams. Reproducido con autorización)

Como siempre, determinar los límites del problema es un tema fundamental en la formulación del mismo. Este punto se pone de manifiesto de manera aún más clara en «La historia del barómetro»[2], escrita por un profesor de física, el doctor Alexander Calandra de la Universidad de Washington en St. Louis:

Hace algún tiempo recibí una llamada de un colega para preguntarme si quería hacer de árbitro en la calificación de una pregunta de examen. Por lo visto a un estudiante se le había puesto un cero por su respuesta a una cuestión de física, mientras que él reclamaba que merecía la nota máxima y que se la habrían dado si no fuera porque el sistema siempre va en contra del alumno. Estudiante y profesor acordaron someter el asunto a un árbitro imparcial, y yo había sido el elegido.

Fui al despacho de mi colega y leí la pregunta en cuestión, que decía así: «Mostrar cómo se puede determinar la altura de un edificio elevado con la ayuda de un barómetro».

La respuesta del estudiante era: «Se toma el barómetro en lo alto del edificio, se le ata una cuerda larga, se baja el barómetro hasta el suelo y después se vuelve a subir midiendo la longitud de cuerda que hubo que soltar. Esta longitud es la altura del edificio».

Era una respuesta en verdad interesante, pero ¿había que aprobar a su autor? Por mi parte señalé que el estudiante merecía sin duda la nota máxima, pues había contestado la cuestión completa y correctamente. Por otro lado, si se le daba la nota máxima, esto podía contribuir a que el estudiante aprobara el curso de física. Un aprobado se supone que certifica que el estudiante sabe algo de física, pero la respuesta a la pregunta no lo confirmaba. Con esto en mente, sugerí darle al estudiante otra oportunidad para responder la cuestión. No me sorprendió que mi colega profesor estuviera de acuerdo, pero sí que lo estuviera también el alumno.

En virtud del acuerdo, le concedí al estudiante seis minutos para responder, con la advertencia de que la respuesta debería denotar algún conocimiento de física. Al cabo de cinco minutos todavía no había escrito nada. Le pregunté si quería dejarlo, pues tenía que hacerme cargo de otra clase, pero dijo que no, que tenía muchas respuestas en mente, sólo estaba pensando cuál era la mejor. Me disculpé por interrumpirle y le rogué que continuara. En el minuto que quedaba escribió rápidamente la respuesta, que era ésta: «Se toma el barómetro en lo alto del edificio y se apoya en el borde del techo. Se deja caer, midiendo lo que tarda en llegar al suelo con un cronómetro. Después, empleando la fórmula S = 1/2gt2 [distancia recorrida en la caída igual a una mitad de la aceleración de la gravedad por el tiempo transcurrido al cuadrado], se calcula la altura del edificio».

En este punto pregunté a mi colega si se daba por vencido. Él asintió y le puse al estudiante un notable. Cuando mi colega se fue, recordé que el estudiante había dicho que tenía otras respuestas al problema y le pregunté cuáles eran. «Oh, sí», dijo él. «Hay muchas maneras de averiguar la altura de un edificio grande con la ayuda de un barómetro. Por ejemplo, se puede coger el barómetro en un día soleado, medir la altura del barómetro y la longitud de su sombra y después la longitud de la sombra del edificio, y por medio de una proporción simple se determina la altura del edificio».

«Muy bien», dije. «¿Y las otras?»

«Sí», dijo el estudiante. «Hay una medición muy básica que le gustará. Se coge el barómetro y se comienza a subir las escaleras. A medida que se sube, se marca la longitud del barómetro y esto nos dará la altura del edificio en unidades barométricas. Un método muy directo.

»Naturalmente, si prefiere un método más sofisticado, puede atar el barómetro al final de una cuerda, hacerlo oscilar como un péndulo y determinar el valor de g [la aceleración de la gravedad] a la altura de la calle y en lo alto del edificio. A partir de la diferencia entre los dos valores de g se puede calcular en principio la altura del edificio.»

Finalmente, concluyó: «Si no me tuviera que limitar a las soluciones físicas del problema, hay muchas otras, como por ejemplo coger el barómetro por la base y golpear en la puerta del portero. Cuando éste conteste, se le dice lo siguiente:

»Querido señor portero, aquí tengo un barómetro de muy buena calidad. Si me dice la altura de este edificio, se lo regalo.»

Capítulo 18
Superstición y escepticismo

En contraste con las presiones selectivas que caracterizan la empresa científica (por lo menos en su versión más pura), otras formas de selección muy diferentes han influido también en la evolución de las ideas teóricas acerca de los mismos temas que ahora son competencia de la ciencia. Un ejemplo lo constituye la apelación a la autoridad, independiente de la comparación con la naturaleza. En la Europa medieval y renacentista, las apelaciones a la autoridad (por ejemplo Aristóteles, por no citar la Iglesia Católica) eran la regla en campos donde más tarde sería extensamente aplicado el método científico. Cuando fue fundada la Royal Society de Londres en 1661, el lema elegido fue Nullius in verba. Mi interpretación de esta frase es «no hay que creer en las palabras de nadie», y representaba un rechazo de la apelación a la autoridad en favor de la apelación a la naturaleza, propia de la relativamente nueva disciplina de la «filosofía experimental», que ahora recibe el nombre de ciencia natural.

Nos hemos referido ya a sistemas de creencias, como la magia simpática, que responden predominantemente a presiones selectivas muy diferentes de la comparación entre predicciones y observación. En los últimos siglos la empresa científica ha prosperado y ha conquistado unos dominios donde la autoridad y la magia han cedido el paso en gran medida al consorcio de observación y teoría. Pero fuera de estos dominios las viejas formas de pensamiento se encuentran por doquier y proliferan las supersticiones. La omnipresencia de la superstición al lado de la ciencia, ¿es un fenómeno peculiar de los seres humanos o cabría esperar que los sistemas complejos adaptativos inteligentes de cualquier parte del universo mostrasen las mismas propensiones?

Confusiones en la identificación de regularidades

Los sistemas complejos adaptativos identifican regularidades en el flujo de datos que reciben, y comprimen dichas regularidades en esquemas. Dado que es fácil cometer dos clases de error — confundir aleatoriedad con regularidad y viceversa— es razonable suponer que los sistemas complejos adaptativos tenderían a evolucionar hacia una situación de relativo equilibrio en que la identificación correcta de algunas regularidades estaría acompañada de ambos tipos de confusión.

Contemplando las pautas del pensamiento humano podemos identificar, grosso modo, la superstición con la primera clase de error y la negación de la realidad con la segunda. Las supersticiones tienen que ver por lo general con la percepción de un orden donde de hecho no existe, y la negación de la realidad equivale al rechazo de la evidencia de regularidades, a veces aunque salten a la vista. A través de la introspección y la observación de otros seres humanos, cualquiera puede detectar la asociación de ambos tipos de error con el miedo.

En el primer caso, la gente tiene miedo de lo impredecible y, especialmente, de lo incontrolable de muchas de las cosas que percibimos a nuestro alrededor. La causa última de una parte de esta impredictibilidad es la indeterminación fundamental de la mecánica cuántica y las restricciones adicionales a la predicción impuestas por el caos. Una gran cantidad de incertidumbre añadida, con la consecuente impredictibilidad, procede de las limitaciones en capacidad y alcance de nuestros sentidos e instrumentos, con los que sólo podemos captar una minúscula fracción de la información disponible en principio acerca del universo. Finalmente, estamos lastrados por nuestra inadecuada comprensión del mundo y nuestra limitada capacidad de cálculo.

La carencia resultante de motivos y razón nos da miedo, y ello nos induce a imponer sobre el mundo que nos rodea, incluso sobre los hechos aleatorios y los fenómenos azarosos, un orden artificial basado en falsos principios de causalidad. De este modo nos confortamos con una fantasía de predictibilidad e incluso de dominio, y nos hacemos la ilusión de que podemos manipular el mundo que nos rodea invocando a las fuerzas imaginarias que nos hemos inventado.

En el caso de la negación de la realidad, sí que captamos regularidades auténticas, pero nos causan tal pánico que cerramos los ojos y negamos su existencia. Evidentemente, la regularidad más amenazadora en nuestras vidas es la certeza de la muerte. Numerosas creencias, incluidas algunas de las más tenazmente persistentes, sirven para aliviar la ansiedad que genera. Cuando las creencias específicas de esta clase son ampliamente compartidas en el seno de una cultura, su efecto tranquilizador sobre el individuo se multiplica.

Pero tales creencias acostumbran a incluir regularidades inventadas, por lo que la negación de la realidad va acompañada de la superstición. Por otra parte, examinando de nuevo las supersticiones del tipo de la magia simpática, observamos que la creencia en ellas sólo puede mantenerse negando sus defectos manifiestos, especialmente sus frecuentes fracasos. La negación de regularidades reales y la imposición de regularidades falsas son pues dos caras de la misma moneda. Aparte de que los seres humanos sean proclives a ellas, ambas tienden a ir de la mano y reforzarse mutuamente.

Si este análisis tiene alguna justificación, entonces podemos concluir que los sistemas complejos adaptativos inteligentes que pueda haber dispersos por el universo deberían mostrar una tendencia a errar en ambas direcciones en el proceso de identificación de regularidades en sus datos de entrada. En términos más antropomórficos, podemos esperar que en todas partes los sistemas complejos adaptativos inteligentes sean proclives a una mezcla de superstición y negación de la realidad. Si tiene sentido, aparte de la experiencia humana, describir esta mezcla en términos de alivio de ciertos temores es otro asunto.

Un punto de vista ligeramente diferente sobre la superstición en un sistema complejo adaptativo sugiere que quizá tienda a predominar sobre la negación de la realidad. Se puede considerar que el sistema ha evolucionado en gran parte para descubrir modelos, de modo que, en cierto sentido, los modelos acaban por constituir en sí mismos una recompensa, incluso aunque no confieran ninguna ventaja especial en el mundo real. Un modelo de esta clase puede contemplarse como un «esquema egoísta», algo análogo al gen egoísta e incluso al gen literalmente egoísta.

No es difícil encontrar ejemplos procedentes de la experiencia humana. Hace pocos años fui invitado a un encuentro con un grupo de distinguidos académicos de otras ciudades que habían venido a discutir sobre un descubrimiento fascinante. Resultó que estaban entusiasmados con algunas fotografías recientes de la NASA donde se veían rasgos de la superficie de Marte que recordaban vagamente una cara humana. No puedo imaginar qué ventaja habría podido conferir esta incursión en la improbabilidad a aquellas personas por lo demás brillantes, aparte del mero regocijo de descubrir una misteriosa regularidad.

El mito en el arte y en la sociedad

Numerosas presiones selectivas, aparte del alivio de los temores, favorecen la distorsión del proceso de identificación de regularidades en los seres humanos, especialmente en el nivel social. Las supersticiones pueden servir para afianzar el poder de chamanes y sacerdotes. Un sistema de creencias organizado, completado con mitos, puede motivar la sumisión a determinados códigos de conducta y consolidar los lazos de unión entre los miembros de una sociedad.

En el transcurso de las edades, los sistemas de creencias han servido para organizar a la humanidad en grupos internamente cohesionados y a veces intensamente competitivos, hasta el punto de que con frecuencia se producen conflictos y persecuciones, acompañados a veces de violencia a gran escala. Por desgracia no es difícil encontrar ejemplos en el mundo actual.

Pero las creencias en competencia son sólo una de las bases de la división de las personas en grupos incapaces de congeniar con algún otro. Cualquier etiqueta sirve (una etiqueta es, citando de la tira cómica B. C., «algo que se coloca a la gente para poder odiarla sin tener que conocerla primero»). Muchas atrocidades a gran escala (y crueldades individuales) han sido perpetradas sobre grupos étnicos, muchas veces sin conexión con creencias particulares.

Al lado de los efectos devastadores de los sistemas de creencias, sus aspectos positivos también resaltan vivamente, especialmente las magníficas obras de arte que ha inspirado la mitología en la música, la arquitectura, la literatura, la escultura, la pintura y la danza. Sólo el ejemplo de las figuras negras de los jarrones griegos arcaicos bastaría para dar testimonio de la energía creativa liberada por el mito.

Ante la abrumadora magnificencia de gran parte del arte relativo a la mitología, se hace necesario reexaminar el significado de las falsas regularidades. Además de ejercer una poderosa influencia sobre el intelecto y las emociones humanas y conducir a la creación de grandes obras de arte, los mitos tienen una clara significación adicional que trasciende su falsedad literal y sus conexiones con la superstición.

Sirven para encapsular la experiencia adquirida a lo largo de siglos y milenios de interacción con la naturaleza y con la cultura humana. No sólo contienen lecciones, sino también, al menos por implicación, normas de conducta. Constituyen partes vitales de los esquemas culturales de las sociedades que funcionan como sistemas complejos adaptativos.

La búsqueda de modelos en las artes

La creencia en determinados mitos es sólo una de las muchas fuentes de inspiración para las artes (igual que sólo es una de las muchas fuentes de odio y atrocidades). No es sólo en conexión con el mito que las artes se alimentan de modelos asociativos y regularidades no reconocidas por la ciencia.

T odas las artes florecen sobre la identificación y explotación de tales modelos. La mayoría de símiles y metáforas son modelos que la ciencia podría ignorar, pero ¿qué sería de la literatura, y especialmente de la poesía, sin metáforas? En las artes visuales, una gran obra a menudo transporta al espectador hacia nuevas maneras de ver las cosas. El reconocimiento y creación de modelos es una actividad esencial en toda forma de arte. Los esquemas resultantes están sujetos a presiones selectivas que muchas veces (aunque no siempre) están muy lejos de las que operan en la ciencia, lo que tiene maravillosas consecuencias.

Podemos pues contemplar el mito y la magia al menos desde tres perspectivas diferentes y complementarias:

  1. Como teorías atractivas pero acientíficas, regularidades confortadoras pero falsas, impuestas a la naturaleza.
  2. Como esquemas culturales que contribuyen, para bien o para mal, a dar a las sociedades una identidad propia.
  3. Como parte de la gran búsqueda de modelos, de asociaciones creativas, que incluye el trabajo artístico y enriquece la vida humana.

¿ Un equivalente moral de la fe?

La cuestión que surge de modo natural es si hay alguna manera de aprehender las espléndidas derivaciones de las creencias míticas sin el autoengaño asociado a ellas ni la intolerancia que a menudo las acompaña. En el siglo pasado se produjo un amplio debate sobre el concepto de «equivalente moral de la guerra». Tal como yo lo entiendo, la cuestión es que la guerra inspira lealtad, autosacrificio, valor e incluso heroísmo, y proporciona una salida al afán de aventura, pero también es cruel y destructiva en grado sumo. Por lo tanto, uno de los retos de la especie humana es encontrar actividades que tengan los rasgos positivos característicos de la guerra sin que lleven aparejados los negativos. Ciertas organizaciones intentan alcanzar esta meta planteando desafíos en forma de viajes aventureros a jóvenes que de otro modo no tendrían la oportunidad de llevar una vida al aire libre. Se tiene la esperanza de que tales actividades puedan constituir un sustitutivo no sólo de la guerra, sino también de la delincuencia y el crimen.

Si en lugar de la guerra y el crimen pensamos en la superstición, uno puede preguntarse si puede hallarse un equivalente moral de la fe. ¿Se puede derivar la satisfacción espiritual, el consuelo, la cohesión social y las brillantes creaciones artísticas que acompañan a los mitos de otra cosa que no sea la aceptación de estos como una verdad literal?

La respuesta podría residir en parte en el poder del ritual. Se dice que el vocablo griego mithos, de donde deriva la palabra «mito», se refería en tiempos antiguos a las palabras que se pronunciaban en el curso de una ceremonia. En cierto sentido, los actos eran lo principal, y lo que se decía sobre ellos era secundario. De hecho, a menudo se había perdido, al menos parcialmente, el significado original del ritual, y el mito superviviente representaba una tentativa de explicación por medio de la interpretación de iconos del pasado y la recomposición de fragmentos de antiguas tradiciones referidas a una etapa cultural hace tiempo olvidada. Así pues, los mitos estaban sujetos al cambio,

mientras que era la continuidad del ritual lo que contribuía a mantener la cohesión social. Siempre y cuando el ritual persista, ¿sería posible que se desmoronase la creencia literal en la mitología sin que esto representara una perturbación excesiva?

Otra respuesta parcial podría relacionarse con la percepción de la ficción y el drama. Los grandes personajes de la literatura parecen tener vida propia, y sus experiencias son citadas a menudo como fuente de sabiduría e inspiración, como si de personajes mitológicos se tratara. Pero nadie pretende que estos productos de ficción sean literalmente reales. ¿Existe alguna oportunidad, pues, de que muchos de los beneficios sociales y culturales de la fe puedan preservarse mientras el aspecto negativo del autoengaño se desvanece poco a poco?

Una última respuesta parcial podrían darla las experiencias místicas. ¿Es posible que algunos de los beneficios espirituales que se derivan a menudo de las supersticiones puedan obtenerse, al menos por ciertas personas, a través de técnicas de adiestramiento que faciliten tales experiencias?

Desafortunadamente, en el mundo contemporáneo la fe literal en la mitología, lejos de estar desapareciendo, está en aumento en muchos lugares. Los movimientos fundamentalistas ganan fuerza y amenazan a las sociedades modernas con la imposición de normas de conducta restrictivas y anticuadas y limitaciones a la libertad de expresión. (Por otra parte, tampoco allí donde la mitología está en declive se observa necesariamente una gran mejora en las relaciones entre los diversos grupos humanos, ya que ligeras diferencias de cualquier clase pueden bastar para mantener la hostilidad entre ellos.)

Para una reflexión profunda sobre el tema de las supersticiones recomiendo el libro Wings of Illusion (Las alas de la ilusión), de John F. Schumaker, aunque tienda a desconfiar de nuestra capacidad como especie para prescindir de nuestros entramados de ilusiones consoladoras y, a menudo, inspiradoras.

El movimiento escéptico

En las dos últimas décadas, la persistencia de supersticiones anticuadas se ha visto acompañada, al menos en los países occidentales, de una oleada de popularidad de lo que se ha dado en llamar movimiento New Age, muchas de cuyas convicciones no son más que supersticiones pseudocientíficas contemporáneas, o supersticiones viejas con nombres nuevos, como «canalización» en vez de «espiritismo». Los medios de comunicación y los libros populares las pintan como si fueran factibles o altamente probables, lo que ha hecho que surja un movimiento alternativo para contrarrestar estas afirmaciones, el movimiento escéptico, del que se han formado asociaciones locales por todo el mundo. (En tres de los sitios donde he pasado buena parte de mi tiempo no vendría mal una buena dosis de escepticismo: Aspen, Santa Fe y el sur de California.)

Las organizaciones escépticas locales están más o menos ligadas a un comité con base en los Estados Unidos que responde a las siglas CSICOP (Committee for Scientific Investigation of Claims of the Paranormal). El CSICOP, que edita la revista Skeptical Inquirer, no es una organización abierta al público, sino que sus miembros son electos. A pesar de algunas reservas acerca de la organización y su revista, cuando me propusieron formar parte de ella hace unos años acepté porque me gusta la labor que lleva a cabo.

Las afirmaciones acerca de los llamados fenómenos paranormales nos llegan desde todas partes. Algunas de las más ridículas pueden encontrarse en las portadas de publicaciones de pequeño formato vendidas en el mostrador de los supermercados: «El gato se come al loro. ahora habla. Kitty quiere una galleta» «Cientos de personas que han regresado de la muerte describen el cielo y el infierno» «Un increíble hombre pez puede respirar bajo el agua» «Gemelos siameses encuentran a su hermano de dos cabezas» «Un extraterrestre me dejó embarazada». El CSICOP no se molesta en ocuparse de tonterías tan manifiestas. Pero sí que se irrita cuando periódicos, revistas o cadenas de radio y televisión de gran difusión tratan como hechos rutinarios e indiscutibles, como establecidos o muy probables, cosas que de ninguna manera están probadas: fenómenos como la regresión hipnótica a vidas anteriores, los médiums que proporcionan pistas a la policía o la psicocinesis (la capacidad de mover objetos con la mente). Estas afirmaciones desafían las leyes aceptadas de la ciencia basándose en evidencias que una investigación cuidadosa revela como muy pobres o completamente inexistentes. Velar porque los medios de comunicación no presenten tales cosas como reales o probables es una valiosa actividad del CSICOP.

¿Qué significa paranormal?

Si nos fijamos en las implicaciones del nombre de la organización surgen, sin embargo, algunas cuestiones. ¿Qué se entiende por paranormal? Por supuesto, lo que la mayoría de quienes trabajamos en ciencia (y de hecho mucha gente razonable) queremos saber antes que nada sobre cualquier pretendido fenómeno es si realmente se produce y hasta qué punto las afirmaciones sobre él son verdaderas. Pero si un fenómeno es auténtico, ¿cómo puede ser paranormal? Los científicos, y también muchos no científicos, están convencidos de que la naturaleza obedece a leyes regulares. En cierto sentido, por lo tanto, no puede existir nada paranormal. Cualquier cosa que ocurra realmente en la naturaleza puede ser descrita dentro del marco de la ciencia. Por supuesto, no siempre estamos en disposición de elaborar un informe científico sobre un fenómeno dado, y podemos preferir, por ejemplo, una descripción poética. A veces el fenómeno es demasiado complicado para que una descripción científica detallada sea factible. Pero, en principio, cualquier fenómeno auténtico tiene que ser compatible con la ciencia.

Si se descubre (y se confirma de modo fidedigno) algo nuevo que no encaja en las leyes científicas existentes, no nos llevamos las manos a la cabeza. En vez de eso, ampliamos o modificamos las leyes de la ciencia para acomodar el nuevo fenómeno. Esto coloca en una extraña posición lógica a cualquiera que esté implicado en la investigación científica de las afirmaciones sobre fenómenos paranormales, porque en última instancia nada que ocurra realmente puede ser paranormal. Quizá por esto tengo a veces una vaga sensación de decepción cuando leo la por otra parte excelente revista Skeptical Inquirer. Falta el suspense. Leyendo el título de un artículo se suele adivinar el contenido, es decir, que todo lo que hay en el título es falso. Casi todo lo que se discute en la revista acaba siendo desacreditado. Es más, muchos de los autores parecen sentirse obligados a examinar con lupa todo nuevo caso, aunque en el mundo real cualquier investigación sobre algún fenómeno complejo siempre suele dejar al principio algunos cabos sueltos. Es cierto que me complace ver desacreditadas cosas tales como la cirugía psíquica y la levitación a través de la meditación. Pero pienso que una ligera redefinición de su misión contribuiría a que la organización se asentase sobre bases más sólidas y la revista fuera más viva e interesante. Creo que la auténtica misión de la organización es estimular el examen escéptico y científico de los informes sobre fenómenos misteriosos, especialmente los que parecen desafiar las leyes de la ciencia, pero sin hacer uso de la etiqueta «paranormal» con su implicación de descrédito. Muchos de estos fenómenos acabarán presentándose como una farsa o tendrán explicaciones prosaicas, pero unos pocos podrían resultar básicamente auténticos además de interesantes. El concepto de paranormal no me parece útil; y el espíritu desacreditador, aunque es absolutamente apropiado para la mayoría de temas tratados, no siempre constituye una aproximación completamente satisfactoria.

A menudo nos enfrentamos con situaciones donde hay implicado un fraude consciente, se tima a la gente crédula, pacientes seriamente enfermos acuden a curas inútiles (como la cirugía psíquica) desviándose de tratamientos legitimados que podrían ayudarles, etc. Desacreditar a los responsables es un servicio que se presta a la humanidad. Aun entonces, sin embargo, deberíamos pensar un poco en las necesidades emocionales de las víctimas de los charlatanes y en cómo podrían satisfacerse sin recurrir al autoengaño.

Yo recomendaría a los escépticos que dediquen aún más esfuerzos a comprender las razones por las que tanta gente quiere o necesita creer. Si la gente no fuera tan receptiva, los medios de comunicación no encontrarían tan rentable destacar lo que se califica como paranormal. De hecho, no es únicamente una falta de comprensión sobre el grado de evidencia de un fenómeno lo que subyace en la tendencia a creer en él. En mis discusiones con personas que creen en seis cosas imposibles cada día antes del desayuno, como la Reina Blanca de A través del espejo, he descubierto que el rasgo principal que comparten es la disociación entre creencia y evidencia. De hecho, muchas de estas personas confiesan libremente que creen en lo que les gusta creer. La evidencia no tiene nada que ver. Alivian su temor ante lo azaroso identificando regularidades allí donde no existen.

Aberración mental y sugestionabilidad

En cualquier discusión sobre creencias extrañas hay dos temas obligados: la sugestionabilidad y la aberración mental. Las encuestas revelan, por ejemplo, que un porcentaje asombrosamente elevado de personas cree en la existencia de «alienígenas que vienen en platillos volantes». Hay quienes incluso pretenden que han sido secuestrados y examinados de cerca por ellos, y hasta abordados sexualmente. Uno tiene la impresión de que se trata de gente que por alguna razón tiene dificultades para distinguir la realidad de la fantasía, y es natural preguntarse si algunos padecen alguna enfermedad mental seria.

También podría pensarse que algunas de estas personas son desacostumbradamente sugestionables. Un hipnotizador podría poner en trance a uno de tales sujetos y hacerle creer cualquier fantasía con la mayor facilidad; quizá tenga lugar un proceso parecido de forma más o menos espontánea. La facilidad para caer en trance quizá constituya una desventaja potencial, pero también podría resultar ventajosa al facilitar, aparte de la hipnosis, la autohipnosis o la meditación profunda, permitiendo así acceder a formas de autocontrol difíciles (aunque no imposibles) de conseguir por otros medios.

En muchas sociedades tradicionales no es raro que las personas que muestran una extraordinaria susceptibilidad al trance encuentren un sitio como chamanes o profetas. Lo mismo ocurre con quienes sufren ciertos tipos y grados de trastorno mental. La posibilidad de una experiencia mística es seguramente mayor en estas personas que en la gente corriente. En cuanto a las sociedades modernas, se dice que algunos de los artistas más creativos pueden encuadrarse en una u otra categoría. (Naturalmente, todas estas supuestas correlaciones tendrían que ser cuidadosamente comprobadas.)

Las características mentales de la gente que cree en fenómenos escandalosamente improbables, especialmente de individuos que afirman haber tenido una participación personal en ellos, están siendo objeto de investigación. Hasta ahora, la evidencia de enfermedades mentales serias o de alta susceptibilidad al trance es sorprendentemente pobre. Más bien parece que en muchos casos una fuerte creencia influye en la interpretación de una experiencia ordinaria con algún fenómeno físico o estado mental inducido por el sueño o las drogas. Pero la investigación está aún en pañales. Personalmente creo que es deseable intensificar el estudio de las creencias y sistemas de creencias entre los seres humanos y de sus causas subyacentes, pues considero que el tema tiene una importancia capital para nuestro futuro a largo plazo.

Escepticismo y ciencia

Supongamos que todos convenimos en que el movimiento escéptico, aparte de estudiar el tema de las creencias y comprometerse en actividades como desenmascarar el fraude y velar por la rectitud de los medios de comunicación, debe ocuparse del examen, desde una perspectiva escéptica y científica, de los informes de fenómenos misteriosos que parecen desafiar las leyes de la ciencia. Entonces el grado de escepticismo aplicado debería ajustarse a la magnitud del desafío que el supuesto fenómeno representa para las leyes admitidas. Aquí hay que andarse con mucho cuidado. En ámbitos complicados como, por ejemplo, la meteorología o la ciencia planetaria (geología incluida), puede alegarse la existencia de fenómenos extraños que desafían ciertos principios aceptados en esos ámbitos pero que no parecen violar leyes fundamentales de la naturaleza como la conservación de la energía. Las leyes empíricas o fenomenológicas de tales ámbitos son a veces muy difíciles de relacionar con las leyes de ciencias más básicas, y continuamente se hacen nuevos descubrimientos que requieren la revisión de dichas leyes empíricas. Un supuesto fenómeno que viola estas leyes no es tan sospechoso como uno que viola la conservación de la energía.

Hace sólo treinta años la mayoría de geólogos, incluidos casi todos los miembros de la distinguida facultad de geología de Caltech, todavía desechaba desdeñosamente la idea de la deriva continental. Lo recuerdo porque a menudo discutía con ellos sobre el asunto por aquel entonces. A pesar de la acumulación de pruebas en su favor, se mostraban incrédulos ante esta teoría. La consideraban una tontería principalmente porque la comunidad geológica no tenía un mecanismo plausible para ella. Pero un fenómeno puede perfectamente ser auténtico aunque no se haya encontrado una explicación plausible de él. En estos casos es poco aconsejable descartar un fenómeno hipotético sólo porque los expertos no pueden imaginar una causa directa que lo justifique. Los científicos planetarios de hace dos siglos cometieron el notorio error de desacreditar los meteoritos. «¿Cómo pueden caer rocas del cielo», objetaban, «cuando todo el mundo sabe que no hay rocas en el cielo?»

Hoy día existe una fuerte tendencia entre mis amigos del movimiento escéptico, y también entre mis colegas físicos, a descartar demasiado deprisa las afirmaciones sobre la elevada incidencia de cánceres raros en personas que están más expuestas de lo normal a campos electromagnéticos relativamente débiles procedentes de dispositivos y líneas de corriente alterna de 60 ciclos por segundo. Los escépticos pueden muy bien estar en lo cierto al rechazar tales afirmaciones como falsas, pero la cosa no es tan obvia como algunos dicen. Aunque los campos son demasiado débiles para producir efectos notables como, por ejemplo, un incremento sustancial de temperatura, sí que podrían tener efectos mucho más sutiles sobre ciertas células altamente especializadas inusualmente sensibles al magnetismo por la presencia en su interior de cantidades apreciables de magnetita. Joseph Kirschvink (quien tiene unos intereses poco habituales en un profesor de Caltech) está investigando experimentalmente esta posibilidad y ha hallado algunos indicios preliminares de que la supuesta conexión del magnetismo con estos cánceres raros podría ser algo más que una mera fantasía.

Relámpagos en bola

Ciertos fenómenos atmosféricos permanecen hasta el día de hoy en una especie de limbo. Éste es el caso de los llamados «relámpagos en bola». Algunos observadores declaran haber visto en tiempo tormentoso una bola brillante, algo parecido a un relámpago esférico. Hay quien dice haberlas visto entrar en una habitación por la ventana, rodar hacia dentro y desaparecer después dejando una tenue llama. Aunque abundan los relatos anecdóticos de toda clase, no existe una evidencia incontrovertible ni tampoco una teoría satisfactoria sobre ellas. Un físico, Luis Alvarez, sugirió que los relámpagos en bola eran sólo un efecto óptico. Esta explicación, sin embargo, no se ajusta demasiado bien a las referencias anecdóticas fiables como, por ejemplo, las recogidas por un científico a partir de entrevistas con empleados de un laboratorio estatal. Algunos teóricos han investigado seriamente el fenómeno. Mientras se encontraba bajo arresto domiciliario por negarse a trabajar en el desarrollo de armas termonucleares bajo la tutela de Lavrenti P. Beria, jefe del servicio secreto de Stalin, el gran físico ruso Pyotr L. Kapitsa, junto con uno de sus hijos, escribió un artículo teórico proponiendo un mecanismo hipotético para los relámpagos en bola. Otros han intentado reproducir el fenómeno en el laboratorio. Pero hay que decir que hasta ahora los resultados no son concluyentes. En pocas palabras, nadie tiene una buena explicación.

Hacia 1951, la mención de los relámpagos en bola causó cierto revuelo en un seminario del Instituto de Estudios Avanzados de Princeton, en el que Harold W. («Hal») Lewis, ahora profesor de física de la Universidad de California en Santa Barbara, presentaba un trabajo teórico en colaboración con Robert Oppenheimer. Creo que fue el último trabajo de investigación de Robert antes de convertirse en director del Instituto, y estaba muy inquieto esperando que la gente prestase atención a la ponencia de Hal que resumía el artículo de Oppenheimer, Lewis y Wouthuysen sobre la creación de mesones en colisiones protón-protón. En el curso de la discusión posterior, alguien mencionó que Enrico Fermi había propuesto un modelo en el que los dos protones se mantenían unidos durante largo tiempo por razones desconocidas emitiendo mesones de manera estadística. Muchos de nosotros nos sumamos a la discusión con propuestas acerca de la causa posible de este comportamiento. El erudito físico teórico suizo Markus Fierz intervino haciendo notar que no siempre está claro por qué las cosas se mantienen unidas. «Por ejemplo», dijo, «pensemos en los relámpagos en bola.» (Oppenheimer comenzó a ponerse rojo de ira. Acababan de presentar su último articulo científico y Fierz estaba desviando la discusión hacia los relámpagos en bola.) Fierz vino a decir que un amigo suyo había sido empleado por el gobierno suizo y se le había concedido un pase especial de ferrocarril para que pudiese viajar por todo el país en busca de testimonios sobre los relámpagos en bola. Finalmente, Robert no pudo aguantar más y salió con gesto airado de la sala murmurando: «¡Relámpagos en bola, relámpagos en bola!». No creo que nuestra comprensión del fenómeno haya aumentado mucho desde entonces (ni siquiera aunque el propio Hal Lewis haya escrito un interesante artículo sobre él).

Lluvias de peces

Uno de mis ejemplos favoritos de fenómeno misterioso es la lluvia de peces y ranas. Muchos de los testimonios son muy detallados y de buena fuente. Aquí tenemos uno de A. B. Bajkov describiendo una lluvia de peces en Marksville, Louisiana, el 23 de octubre de 1947:

«Me encontraba dirigiendo investigaciones biológicas para el Departamento de Fauna y Pesca. Aquel día, entre las siete y las ocho de la mañana, comenzaron a caer peces de entre dos y nueve pulgadas sobre las calles y patios de aquella población sureña, dejando atónitos a sus habitantes. Yo estaba en el restaurante con mi mujer tomando el desayuno cuando la camarera nos informó de que estaban lloviendo peces. Salimos inmediatamente para coger algunos. La gente estaba entusiasmada. El director del Marksville Bank, J. M. Barham, me contó que al levantarse de la cama se encontró con que habían caído cientos de peces en su patio y en el de su vecina Mrs. J. W. Joffrion. El cajero del mismo banco, J. E. Gremillion, y dos comerciantes, E. A. Blanchart y J. M. Brouillette, fueron alcanzados por la lluvia de peces cuando se dirigían a su lugar de trabajo hacia las 7:45.».

(Citado de William R. Corliss en Science, 109, 402, 22 de abril de 1949.)

Todos los meteorólogos a quienes he consultado me han asegurado que no existe ninguna objeción concluyente a la posibilidad de que tales criaturas puedan ser elevadas y transportadas a considerable distancia antes de caer, como resultado de perturbaciones meteorológicas. Aunque los mecanismos específicos, como las trombas marinas, son puramente especulativos, es perfectamente posible que el fenómeno sea auténtico.

Por otra parte, el hecho de que los peces, o por lo menos su puesta, lleguen al suelo vivos podría ser relevante para la zoogeografía, el estudio de la distribución de las especies animales. Ernst Mayr, el gran ornitólogo y zoogeógrafo, comentaba en uno de sus artículos que hay muchos enigmas sobre la distribución de los peces de agua dulce que podrían resolverse si estas criaturas pudieran ser transportadas por medios poco convencionales, como las lluvias de peces.

De la discusión precedente se concluye que, si es cierto que de vez en cuando caen peces del cielo, el proceso no representa ningún perjuicio para las leyes aceptadas por la ciencia, más bien todo lo contrario. Igualmente, si alguna de las supuestas criaturas «criptozoológicas», como el hipotético perezoso gigante de la Amazonia, resultase ser real, esto no alteraría las leyes de la ciencia más de lo que lo hizo el descubrimiento del celacanto en las aguas sudafricanas hace cincuenta años, cuando se creía extinguido desde hacía mucho tiempo. ¿Pero qué se puede decir sobre aquellos fenómenos que supuestamente desafían las leyes de la ciencia tal como las conocemos?

Fenómenos que desafían las leyes conocidas de la ciencia

Aunque tales fenómenos no pueden descartarse ipso facto, hay que aplicarles una alta cuota de escepticismo. Ahora bien, si alguno de ellos resultara ser auténtico, las leyes científicas tendrían que ser modificadas para acomodarlo.

Consideremos el supuesto fenómeno (en el que, dicho sea de paso, yo no creo) de la telepatía entre dos personas estrechamente emparentadas, digamos una madre y un hijo o dos gemelos idénticos. Casi todo el mundo ha oído anécdotas que relatan que, en momentos de extrema tensión de uno de los miembros de la pareja, el otro se siente alarmado, incluso cuando les separa una gran distancia. Lo más probable es que estos testimonios respondan a una combinación de coincidencia, memoria selectiva (olvido de falsas alarmas, por ejemplo), recuerdo distorsionado de las circunstancias (incluyendo una exageración de la simultaneidad), etc. Por otro lado, es muy difícil investigar científicamente estos fenómenos, aunque no es imposible en principio. Por ejemplo, uno puede imaginar un experimento —cruel y por lo tanto prohibido por consideraciones éticas, aunque por otra parte factible— en el que se tomasen muchas parejas de gemelos idénticos, se les separase por una larga distancia y se sometiese a uno de los miembros de cada pareja a una intensa tensión para ver si el otro reacciona. (Hay algunos crédulos, entre ellos varios de mis conocidos de la New Age de Aspen, que creen que efectivamente tal experimento se llevó a cabo con animales a bordo del submarino Nautilus bajo los hielos polares. Según ellos, una coneja madre que viajaba en el submarino mostraba signos de angustia cuando alguna de sus crías era torturada en Holanda.)

En cualquier caso, supongamos por un momento que, contrariamente a lo que yo esperaría, la telepatía entre, digamos, gemelos idénticos resulta ser un fenómeno auténtico. Esto requeriría una profunda revisión de las teorías científicas fundamentales, pero sin duda acabaría por encontrarse alguna explicación. Por ejemplo, los teóricos podrían postular alguna clase de cordón, de naturaleza por ahora desconocida, que probablemente supondría importantes modificaciones de las leyes físicas tal como están ahora formuladas. Este cordón conectaría a ambos gemelos transportando una señal cuando alguno de ellos se encontrase en serias dificultades. De este modo el efecto podría ser en gran parte independiente de la distancia, como muchos de los testimonios sugieren. Una vez más quiero recordar que cito este ejemplo no porque yo crea en la telepatía, sino sólo para ilustrar cómo deberían modificarse las teorías científicas para acomodar fenómenos de lo más extraño en el caso improbable de que resultaran ser auténticos.

Una habilidad genuina: Leer los surcos de los discos

De vez en cuando el CSICOP encuentra que una pretensión en apariencia descabellada está en realidad justificada. T ales casos son debidamente notificados en el Skeptical Inquirer y discutidos en las reuniones, pero en mi opinión debería prestárseles más atención. Así quedaría más claro que lo fundamental es intentar distinguir los hechos auténticos de los falsos y no simplemente desenmascarar el fraude.

Los científicos en conjunto acreditan un escaso porcentaje de éxitos en la investigación de sospechosos de fraude. Con harta frecuencia los farsantes han tomado el pelo a intelectuales reputados, y algunos hasta se han convertido en defensores del charlatán de turno. El CSICOP cuenta con el asesoramiento de un mago, James Randi, para diseñar las pruebas a que deben someterse quienes dicen tener poderes extraordinarios. Randi sabe cómo engañar al público, y es igualmente hábil para adivinar cuándo alguien intenta engañarlo a él. Le encanta desenmascarar impostores y poner en evidencia sus trucos.

Cuando la revista Discover publicó que un hombre era capaz de extraer información leyendo en los surcos de los discos de vinilo, se le encomendó a Randi investigar el asunto. El hombre en cuestión era el doctor Arthur Lintgen, un físico de Pennsylvania que aseguraba que podía mirar un disco de música sinfónica de cualquier época posterior a Mozart e identificar el compositor, a menudo la pieza y a veces hasta el intérprete. Randi le sometió a las rigurosas pruebas habituales y descubrió que en efecto estaba diciendo la verdad. El físico identificó correctamente dos grabaciones distintas de La consagración de la primavera de Stravinski, así como el Bolero de Ravel, Los planetas de Holst y la Sexta sinfonía de Beethoven. Naturalmente, Randi le mostró otros discos a modo de control. Uno, etiquetado «guirigay» por el doctor Lintgen, era del rockero Alice Cooper. Ante otro control dijo: «Esto no es música instrumental. Debe ser un solo vocal de algún tipo». De hecho era la grabación de un hombre hablando, titulada Así que quieres ser un mago.

Esta curiosa habilidad, que resultó ser auténtica, no violaba ningún principio importante. La información estaba presente en los surcos; la cuestión era saber si de verdad había alguien capaz de extraerla por inspección, y Randi confirmó que en efecto lo había.

Capítulo 19
Esquemas adaptativos y no adaptativos

Una historia que el examen escéptico ha desacreditado por completo es la del «centésimo mono». La primera parte del cuento es verdad. Ciertos miembros de una colonia de monos de una pequeña isla japonesa aprendieron a limpiar de arena su comida lavándola en las aguas del lago que rodea la isla, y comunicaron su habilidad a los otros miembros de la colonia. Hasta aquí muy bien. Pero una leyenda New Age retoma estos hechos y va más allá, afirmando que, cuando el mono número cien aprende el truco, entonces, súbitamente y por algún proceso misterioso, todos los miembros de la especie, estén donde estén, adquieren la habilidad y comienzan a practicarla. Naturalmente, no hay ninguna evidencia creíble de nada de esto.

La parte verdadera de la historia es ciertamente interesante por sí misma, como ejemplo de transmisión cultural de un comportamiento aprendido en animales distintos del hombre. Otro ejemplo lo proporciona el comportamiento de los carboneros de ciertas poblaciones inglesas hace algunas décadas. Estos pájaros aprendieron a abrir las botellas de leche, y con el tiempo dicho comportamiento se extendió entre todos los miembros de la especie e incluso de especies próximas. La actividad física requerida para abrir los tapones estaba ya presente en el repertorio de movimientos de las aves; todo lo que tenían que aprender era que la botella de leche contenía una buena recompensa. Hay muchos otros casos conocidos de comportamiento animal novedoso transmitido de esta manera.

ADN cultural

Naturalmente, la transmisión cultural humana puede ser considerablemente más sofisticada. La explicación reside presumiblemente no sólo en la superior inteligencia, sino también en el carácter de las lenguas humanas, que permiten vocalizaciones arbitrariamente complejas. Gracias a tales lenguas, las sociedades humanas exhiben aprendizaje grupal (o adaptación de grupo, o evolución cultural) en un grado mucho mayor que las bandas de otros primates, manadas de perros salvajes o bandadas de aves. Este comportamiento colectivo puede analizarse hasta cierto punto reduciéndolo al de un conglomerado de individuos que actúan como sistemas complejos adaptativos. Ahora bien, como siempre, tal reducción sacrifica las valiosas intuiciones que pueden obtenerse estudiando el fenómeno en su propio nivel. En particular, una simple reducción a la psicología puede descuidar el hecho de que, además de los rasgos generales de los seres humanos individuales, hay una información adicional presente en el sistema que incluye las tradiciones específicas, las costumbres, las leyes y los mitos del grupo. Parafraseando a Hazel Henderson, todas estas cosas pueden contemplarse como «ADN cultural». Encapsulan la experiencia compartida de muchas generaciones y abarcan los esquemas de la sociedad, que funciona a su vez como un sistema complejo adaptativo. De ahí que el biólogo inglés

Richard Dawkins haya acuñado el término «meme» para designar una unidad de información transmitida culturalmente, el análogo de los genes en la evolución biológica.

En realidad, la adaptación tiene lugar en tres niveles diferentes por lo menos, lo que a veces causa confusión en el uso del término. En primer lugar, tiene lugar cierta adaptación directa (como en un termostato o dispositivo cibernético) como resultado de la operación de un esquema dominante en una época particular. Cuando el clima se hace más cálido y seco, una sociedad puede tener la costumbre de trasladarse a las montañas. También puede recurrir a ceremonias religiosas para atraer la lluvia, bajo la supervisión de un sacerdote. Cuando su territorio es invadido por una fuerza enemiga, la sociedad puede reaccionar automáticamente refugiándose en un poblado bien fortificado y con una reserva de provisiones para resistir el asedio. Cuando un eclipse aterroriza a la gente, puede haber chamanes dispuestos con algún abracadabra apropiado. Ninguno de estos comportamientos requiere cambios en los esquemas dominantes.

El segundo nivel incluye cambios de esquema, competencia entre esquemas diversos y su promoción o degradación en respuesta a las presiones selectivas en el mundo real. Si las danzas de la lluvia no consiguen aliviar una sequía, el sacerdote de turno puede caer en desgracia y entrar en juego una nueva religión. En los lugares donde la respuesta tradicional al cambio climático es trasladarse a tierras más elevadas, un pobre resultado de tal esquema puede llevar a la adopción de otras prácticas, como nuevos métodos de irrigación o nuevos cultivos. Si la estrategia de retirarse a una fortaleza no consigue responder adecuadamente a una serie de ataques enemigos, la próxima invasión puede provocar el envío de una fuerza expedicionaria a tierras enemigas.

El tercer nivel de adaptación es la supervivencia darwiniana del más apto. Una sociedad puede simplemente dejar de existir como consecuencia de la incapacidad de sus esquemas para hacer frente a los acontecimientos. No necesariamente tiene que morir todo el mundo, y los individuos que queden pueden crear nuevas sociedades, pero la sociedad en sí desaparece, llevando sus esquemas a la extinción junto con ella. Ha tenido lugar una forma de selección natural en el nivel social.

No es difícil encontrar ejemplos de esquemas que llevan a la extinción. Algunas comunidades (como los esenios en la antigua Palestina y los shakers estadounidenses) han practicado la abstinencia sexual en el pasado, no restringiéndola a unos pocos monjes y monjas, sino haciéndola extensiva a todos los miembros de la comunidad. Con un esquema así, la supervivencia de la comunidad requiere que el número de conversos supere el de fallecimientos. No parece que esto haya sucedido. Los esenios desaparecieron y los shakers son en la actualidad muy escasos. En cualquier caso, la prohibición del comercio sexual es un rasgo cultural que ha contribuido de manera obvia a la extinción total o virtual de la comunidad.

El hundimiento de la civilización maya clásica en las selvas tropicales centroamericanas durante el siglo X es un notable ejemplo de la extinción de una cultura avanzada. Como indicábamos en el capítulo primero, las causas de este hundimiento son aún objeto de controversia; los arqueólogos tienen dudas acerca de los esquemas fallidos —los relativos a las clases sociales, la agricultura en la jungla, la guerra entre ciudades u otras facetas de la civilización—. En cualquier caso, se cree que mucha gente sobrevivió a la crisis y que algunos de los pueblos actuales que hablan lenguajes mayas en el área son sus descendientes. Pero las construcciones de piedra y el levantamiento de estelas para conmemorar fechas señaladas en el calendario maya tocaron a su fin, y las sociedades subsiguientes serían mucho menos complejas que las del período clásico.

En líneas generales, los tres niveles de adaptación tienen lugar en escalas de tiempo diferentes. Un esquema dominante vigente puede ponerse en acción en cuestión de días o meses. Una revolución en la jerarquía de esquemas suele ir asociada a una mayor escala de tiempo, aunque los eventos culminantes pueden tener lugar rápidamente. Las extinciones de las sociedades suelen abarcar intervalos de tiempo todavía más largos.

En las discusiones teóricas dentro de las ciencias sociales, por ejemplo en la literatura arqueológica, la distinción entre los diferentes niveles de adaptación no siempre está clara, lo que frecuentemente lleva a un alto grado de confusión.

La evolución de los lenguajes humanos

En el caso de los lenguajes, al igual que en el de las sociedades, la evolución, aprendizaje o adaptación tienen lugar de diversas maneras y en diferentes escalas temporales. Como ya hemos discutido, la adquisición del lenguaje por un niño representa la actuación de un sistema complejo adaptativo. En una escala de tiempo más larga, la evolución de los lenguajes humanos en el transcurso de siglos o milenios puede contemplarse como otro sistema complejo adaptativo. En una escala de tiempo de cientos de miles o millones de años, la evolución biológica dio lugar a la capacidad de los seres humanos (Homo sapiens sapiens) de comunicarse por medio de lenguajes de tipo moderno. (Todos estos lenguajes tienen ciertas propiedades comunes, como oraciones de longitud arbitraria, estructura gramatical elaborada y elementos gramaticales como pronombres, genitivos diversos, etc.)

Cuando se considera la evolución de la gramática, es importante tener en cuenta los diversos niveles de adaptación. Desde el trabajo pionero de Joe Greenberg, se ha acumulado una considerable cantidad de información sobre los rasgos gramaticales comunes a todos los lenguajes conocidos («universales») y aquéllos que aparecen en casi todos («cuasiuniversales»), Al considerar estos rasgos generales, es obvio que debe prestarse atención a los condicionantes fruto de la evolución biológica, neurológicamente preprogramados, señalados por Chomsky y su escuela. Pero también hay que considerar los resultados de la evolución lingüística al cabo de los siglos y los milenios, los cuales deben reflejar hasta cierto punto las presiones selectivas que favorecen los rasgos gramaticales aptos para la comunicación. Por último, puede haber accidentes congelados, «efectos fundadores» que se originan en la elección arbitraria de rasgos gramaticales de los lenguajes ancestrales de todas las lenguas modernas, y cuyas consecuencias persisten en todas partes hasta el día de hoy (recuérdese que en biología la asimetría entre moléculas dextrógiras y levógiras puede ser uno de tales accidentes congelados). En las discusiones sobre lingüística en el Instituto de Santa Fe, el énfasis se pone en la necesidad de incluir todas estas contribuciones en las tentativas de explicación de los rasgos gramaticales universales y cuasiuniversales.

Al estudiar la evolución de cualquier sistema complejo adaptativo, es esencial separar estos tres factores: las reglas básicas, los accidentes congelados y la selección de lo que es adaptativo. Y, por supuesto, las reglas básicas pueden aparecer como accidentes congelados cuando se contemplan en una escala cósmica de espacio y tiempo.

Adaptación versus adaptativo

La distinción de los diferentes niveles y escalas temporales de la adaptación deja todavía pendiente una serie de enigmas relativos al porqué los sistemas complejos adaptativos del tipo de las sociedades parecen tan a menudo quedarse bloqueados en esquemas no adaptativos. ¿Por qué no han desarrollado esquemas cada vez mejores y progresado hacia una adaptación cada vez mayor? Algunas de las razones ya han sido mencionadas en capítulos anteriores.

Las sociedades, al igual que otros sistemas complejos adaptativos, están a menudo sujetas a presiones selectivas no descritas de modo preciso por ninguna función de adaptación. Y la adaptación misma, como hemos visto, no es algo que simplemente aumente con el tiempo, ni siquiera cuando está bien definida. Además, no existe una correspondencia simple entre rasgos adaptativos y rasgos surgidos a través de las diversas formas de adaptación. Ninguna de estas cuestiones se restringe a las sociedades. Aparecen por doquier en biología y a veces de forma particularmente aguda en la experiencia de los seres humanos individuales. ¿Cuáles son algunos de los mecanismos que permiten la supervivencia de esquemas no adaptativos?

Esquemas no adaptativos: Presiones selectivas externas

Un mecanismo muy general para la persistencia de comportamientos aparentemente no adaptativos ha sido ya discutido con cierta extensión, especialmente en relación con el conflicto entre superstición y ciencia. Las presiones selectivas que afectan a la promoción y degradación de las teorías científicas tienen que ver principalmente con el éxito de estas teorías en la explicación coherente y la predicción correcta de los resultados de la observación, al menos cuando la empresa científica funciona adecuadamente. Cuando no es así es porque otras presiones selectivas, muchas de ellas producto de las debilidades humanas de los científicos, actúan con fuerza.

En el caso de la teorización supersticiosa, las presiones selectivas no científicas tienen un papel dominante. Recapitulemos las que ya hemos mencionado. Estas presiones selectivas incluyen el refuerzo de la autoridad de individuos poderosos y también el mantenimiento de la cohesión social, lo cual confiere una ventaja en la evolución de la sociedad. Por otro lado, la imposición de una estructura falsamente ordenada y regular sobre acontecimientos fundamentalmente aleatorios o hechos desconectados entre sí puede proporcionar cierto grado de consuelo; la ilusión de comprensión y, especialmente, de dominio mitiga el temor a lo incontrolable. Relacionada con ésta tenemos una presión selectiva muy general que hemos asociado con el lema del «esquema egoísta»: cualquier sistema complejo adaptativo ha evolucionado para descubrir patrones, por lo que un patrón constituye en cierto modo una recompensa en sí mismo.

El elemento común en todas estas presiones selectivas es que son en gran parte externas a lo que se considera adaptativo en ciencia, es decir, el éxito en la descripción de la naturaleza. También son en gran parte externas a lo que se considera adaptativo en ingeniería, es decir, el control de la naturaleza con algún propósito humano. Sin embargo, tales presiones selectivas tienen un papel crucial en la evolución del ADN cultural.

De aquí puede extraerse una lección general. El sistema objeto de discusión es definido a menudo de manera que no constituye un sistema cerrado. Presiones selectivas de gran importancia se ejercen desde el exterior. Un ejemplo simple lo encontramos en uno de los procesos que tienen lugar en la evolución de los lenguajes humanos. Supongamos que ciertas tribus o naciones que hablan lenguas diferentes entran en contacto y, al cabo de algunas generaciones, sobreviven con ciertas modificaciones algunas de las lenguas, mientras que otras se extinguen. Las desapariciones dependen menos de los méritos relativos de las diversas lenguas como instrumentos de comunicación que de consideraciones bien distintas, como el poder militar o el acervo cultural de las diferentes tribus o naciones. Éstas son presiones selectivas ejercidas fuera del dominio lingüístico.

En el dominio de la evolución biológica, donde la selección tiene lugar normalmente en el nivel fenotípico, puede haber, como ya hemos discutido, casos excepcionales en que actúe directamente sobre las células germinales: un «gen literalmente egoísta» que promueva la fecundación con éxito de un huevo por parte de un espermatozoide que lo porte, incluso aunque dicho gen pueda ser desventajoso, y hasta dañino, para el organismo resultante.

Lo que todos estos ejemplos sugieren es que la aparente persistencia de esquemas no adaptativos en los sistemas complejos adaptativos puede con frecuencia surgir simplemente de unos criterios demasiado estrechos en la consideración de lo que es adaptativo, teniendo en cuenta todas las presiones selectivas que actúan.

Presiones ejercidas por individuos influyentes

Al estudiar la evolución de las organizaciones humanas, no siempre es ventajoso considerar los miembros individuales de la organización como meros agentes genéricos simplificados. A menudo las decisiones particulares hechas por individuos concretos condicionan en gran manera la historia futura. Aunque puede ser que a largo plazo muchas de las consecuencias de tales decisiones demuestren ser aberraciones temporales que «se curan» con el tiempo, es imposible ignorar el hecho de que los individuos tienen importancia. De este modo el elemento de diseño entra en el cuadro. La carta magna de un estado o federación es redactada por individuos. Aunque muchos de los conflictos que surgen en su preparación representan la competencia entre intereses a gran escala, los compromisos específicos que resultan se fraguan entre hombres de estado particulares. Igualmente, una empresa la dirigen individuos, y el carácter e ideas del jefe o jefes (y a veces también de los otros individuos) tienen una importancia crítica en el éxito o fracaso de la misma.

Al mismo tiempo, una organización se comporta en muchos aspectos como un sistema complejo adaptativo, con esquemas y presiones selectivas. Una firma comercial funciona de acuerdo con una serie de prácticas y procedimientos, establece objetivos para sus diversos departamentos o divisiones, hace planes para el futuro y genera modelos mentales para el funcionamiento general de la empresa. Los modelos, junto con los objetivos, planes, prácticas y procedimientos, constituyen esquemas sujetos a presiones directas ejercidas por los ejecutivos a diversos niveles, desde el gerente hasta el capataz o el jefe de sección. Las auténticas presiones selectivas sobre la empresa en el mundo real tienen que ver, sin embargo, con los beneficios y con la supervivencia en el mercado. Es importante que los clientes se sientan atraídos y después satisfechos. En general, cuando las organizaciones se contemplan a la vez como sistemas complejos adaptativos y como escenarios para el ejercicio de las habilidades de gestión de los individuos, surge la cuestión de la relación entre las presiones de selección últimas que gobiernan la supervivencia de la organización y las presiones selectivas internas ejercidas por los ejecutivos individuales.

W Edwards Deming, el estadístico norteamericano (con un doctorado en física) que asesoró a los japoneses en la reconstrucción de sus industrias tras la segunda guerra mundial, se convirtió en una especie de héroe nacional en Japón. Una década antes de su reciente fallecimiento a la edad de 93 años, fue por fin homenajeado en su país natal, donde sus ideas están ahora ampliamente extendidas y han sido adoptadas por muchas industrias. Quizá lo más conocido de él es su énfasis en la «gestión de calidad total». De las múltiples facetas de la gestión de calidad total, quizá lo más útil aquí sea citar sus restricciones a las presiones internas ejercidas por los ejecutivos, incluso los de categoría media. Son los ejecutivos quienes otorgan recompensas e imponen sanciones. Al crear incentivos para que los empleados actúen de determinada manera, afectan directamente algunos de los principales esquemas organizativos. Ahora bien, ¿están estos efectos directos en consonancia con las presiones selectivas ejercidas en el mundo real? ¿Son recompensados los empleados por actividades que de verdad llevan a la satisfacción del cliente o sólo intentan satisfacer los caprichos del jefe? ¿Se comportan los ejecutivos como un gen literalmente egoísta, influyendo directamente en la supervivencia del esquema de un modo que puede no favorecer la supervivencia del organismo?

Sistemas adaptativos con humanos en bucle

El caso de los ejecutivos en una empresa ejemplifica la situación más general de sistemas adaptativos con humanos en el bucle, sistemas sujetos a lo que a veces se llama evolución dirigida, en la que las presiones selectivas son ejercidas por seres humanos individuales.

Los casos más simples tienen que ver con la adaptación directa, sin esquemas variantes. Considérese el examen de un ojo por parte de un optometrista. Éste nos hace mirar con un ojo un panel con filas de letras acompañadas de líneas verticales y horizontales. El optometrista nos presenta una secuencia de elecciones binarias y, para cada par de imágenes, nos pregunta cuál de las dos es más clara. Al cabo de un rato se llega a la prescripción correcta para cualquier combinación de astigmatismo, miopía y presbicia que presente el ojo en cuestión. El esquema simple ojo-panel se ha ajustado por sí mismo a nuestro ojo.

Un ejemplo no tan trivial procede de la obra de Karl Sims, ahora en Thinking Machines, una compañía que diseña y fabrica computadores paralelos. Sims emplea una pantalla de ordenador de 256 x 256 puntos, cada uno de los cuales puede adquirir uno cualquiera de los colores del espectro. Especificando el color de cada punto se obtiene un patrón. El programa de Sims hace que el ordenador parta de un patrón particular y después genera un juego de variantes por medio de un algoritmo especial. La persona «en el bucle» escoge la que más le gusta. El ordenador ofrece después otro juego de variantes, y así sucesivamente. Al cabo de poco tiempo, el sistema converge hacia un cuadro que resulta atractivo para la persona involucrada. Me han contado que los resultados son a menudo extraordinarios, y que la participación en el proceso crea adicción.

Uno puede imaginar variantes de este método en las que el azar podría intervenir en el algoritmo que genera las opciones ofrecidas en cada etapa. O, lo que viene a ser lo mismo, el ordenador podría emplear un proceso pseudoaleatorio como parte del algoritmo.

En un simposio celebrado en el Instituto de Santa Fe, Chris Langton hizo una breve descripción del trabajo de Sims. Bob Adams, el arqueólogo secretario de la Smithsonian Institution, hizo notar que el algoritmo que gobierna el ofrecimiento de opciones podría él mismo estar sujeto a variación. Si es así, se convertiría en una clase de esquema, cada variante del cual podría contemplarse como un diferente proceso de búsqueda para escudriñar entre la enormemente larga lista de patrones posibles. El proceso de búsqueda particular adoptado (que puede o no incluir un elemento aleatorio) determinará, junto con los resultados de las elecciones hechas por el sujeto humano, el patrón que aparezca finalmente en la pantalla.

Los patrones podrían después ser transferidos a algún medio permanente y sujetos a presiones selectivas como, por ejemplo, la venta en el mercado o los comentarios de los críticos. Los programas que condujeran con más frecuencia (a través de sujetos humanos) a cuadros por los que se pagasen precios relativamente altos o comentarios relativamente favorables podrían ser promocionados, y los otros degradados. Igualmente, los gustos (conscientes o inconscientes) del sujeto humano podrían cambiar bajo la influencia de los precios o comentarios. El programa, el ordenador, el sujeto humano y el mercado o los críticos constituirían entonces un sistema complejo adaptativo con seres humanos en el bucle. De hecho, un sistema así constituiría una caricatura de cómo funciona a veces el proceso creativo de los artistas de verdad.

Todos estamos familiarizados con otro sistema complejo adaptativo que funciona de esta manera: la crianza de animales o el cultivo de plantas para uso humano. Ambas actividades han tenido un papel importante en la historia de la biología moderna. Darwin se refirió repetidamente a ellas en su Origen de las especies con el apelativo de «selección artificial», frente a la cual la selección natural era comparada y contrastada. Las leyes de la genética mendeliana fueron descubiertas por el monje Gregor Mendel a través del cultivo de guisantes. Además, con el cambio de siglo, por la misma época en que la obra de Mendel fue redescubierta y difundida por el mundo, el holandés de Vries, cultivando tulipanes, descubrió las mutaciones.

El criador ejerce presiones selectivas eligiendo para la reproducción posterior sólo algunos de los organismos producidos. Por supuesto, la selección natural interviene también, y muchos de los animales o plantas no consiguen sobrevivir o procrear por razones que no tienen nada que ver con la decisión del criador. El genoma es un esquema, como acostumbra a pasar en la evolución biológica, pero aquí la evolución es en parte dirigida, y los principios del criador también constituyen un esquema, aunque de una clase diferente.

Cuando un criador de caballos pone un animal a la venta o lo incluye en una carrera (o ambas cosas) sus métodos, en analogía con el programa de Karl Sims y las elecciones hechas por el sujeto humano, están siendo expuestos a las presiones selectivas del mercado y del hipódromo. Así, un sistema complejo adaptativo con una componente de evolución dirigida puede convertirse en parte de un sistema complejo adaptativo de orden superior, en el que el carácter de la dirección humana puede evolucionar a su vez.

Ahora bien, imaginemos un criador aficionado y rico al que no le preocupa si sus caballos ganan carreras o si alguien quiere comprarlos. En ese caso, en el contexto del sistema complejo adaptativo de orden superior, los resultados de los métodos de cría probablemente parecerán no adaptativos.

Como los ejecutivos que ofrecen incentivos para un comportamiento que es improbable que atraiga o retenga a los clientes, un criador diletante como éste quizá obtenga una satisfacción personal, pero no está actuando como un hombre de negocios. Desde un punto de vista puramente empresarial, la cría es un fracaso, aunque pueda continuar.

Persistencia de esquemas no adaptativos: Ventanas de maduración

Los esquemas no adaptativos a veces persisten porque el tipo de adaptación relevante ha tocado a su fin, o casi. Los niños pequeños establecen relaciones con personas importantes en su vida: padres, padrastros, hermanos, niñeras, madres de los amigos, etc. Según el doctor Mardi Horowitz, las actitudes y comportamiento de un niño respecto a estas personas están gobernadas por un «esquema personal» relativo a la percepción infantil del individuo en cuestión. Al principio tal esquema está sujeto a variaciones, pero más tarde se hace muy resistente al cambio. A medida que el niño crece, estos esquemas personales pueden afectar profundamente la manera en que se relaciona con otras personas. Todos estamos familiarizados, por ejemplo, con adultos que mantienen una relación infantil paterna o materna con diversos sustitutos. A menudo los esquemas personales parecen ser claramente no adaptativos, y vivir conforme a ellos equivale a lo que suele llamarse comportamiento neurótico, notoriamente difícil de curar.

Una manera conveniente de considerar estas situaciones es en términos de «ventanas de maduración» en oposición a «plasticidad». Un ejemplo extremo de ventana de maduración es el fenómeno de la impronta, popularizado por Konrad Lorenz en su libro El anillo del rey Salomón. Un ganso salvaje recién nacido contemplará al primer animal grande que vea como su progenitor y lo seguirá a todas partes.

Si el animal es Lorenz u otro ser humano, entonces el ganso se verá a sí mismo como humano, y su capacidad para vivir como un ganso normal queda permanentemente comprometida. La ventana de maduración es el breve período tras el nacimiento en el que el ganso identifica a su «madre» y tras el cual dicha identificación queda fijada para siempre. El polluelo de ganso típico ve a su verdadera madre bien pronto, y el programa genético de la impronta es entonces exitoso desde el punto de vista fenotípico. Para el raro polluelo de ganso que adopta como madre a un etólogo como Lorentz, es obvio que el programa es un fiasco. En tal caso el esquema de aprendizaje proporcionado por la impronta no es adaptativo para el individuo implicado. Pero, dado que este esquema funciona bien para la mayoría de individuos, los esquemas genéticos que determinan la impronta no han sido eliminados en el curso de la evolución biológica. Por otra parte, dado que han sobrevivido, los esquemas genéticos responsables de las ventanas de maduración deben conferir alguna ventaja de tipo general. Esta ventaja presumiblemente tiene que ver con la posibilidad, una vez cerrada la ventana, de dejar dispuesta la maquinaria para la adquisición de nueva información.

En los seres humanos también existen ventanas de maduración. Por ejemplo, algunos bebés nacen con problemas visuales que deben corregirse pronto antes de que se hagan irreversibles (al menos mientras no se descubra algún tratamiento eficaz). En otros casos, por así decirlo, las ventanas no son absolutas. Las consecuencias de diversas formas de negligencia en períodos cruciales de la infancia y la niñez pueden ser serias si no se hace nada para remediar el daño, pero en condiciones adecuadas las posibilidades de recuperación pueden ser significativas. Esto es lo que se conoce como «plasticidad», la capacidad del sistema nervioso para reorganizarse de manera que patrones de conducta que de otro modo persistirían indefinidamente puedan de hecho cambiarse.

Un tema capital en política ciudadana, particularmente en los Estados Unidos, es saber hasta qué punto los déficits en la capacidad de aprendizaje adquiridos antes de los dos años y medio pueden remediarse mediante programas como Head Start, que proporciona a los niños una ayuda especial durante aproximadamente los siguientes dos años y medio. Algunos investigadores proclaman que una ventana de maduración temprana tiene aquí un papel crucial, y que los programas terapéuticos en edades posteriores no son ni mucho menos tan efectivos a largo plazo como el mejoramiento del entorno de los bebés. Otros sostienen que han demostrado que existe suficiente plasticidad en este caso para permitir una reversión sustancial y a largo plazo de los déficits de aprendizaje mediante intervenciones del tipo del Head Start, siempre y cuando se lleven a cabo con suficiente intensidad y duración (lo que no siempre es así).

Sea como fuere, se sabe que para la adquisición de un primer lenguaje los primeros años de la vida son críticos. Los pocos casos conocidos de niños criados con escaso o nulo contacto con el lenguaje humano indican que la maquinaria innata para adquirir la gramática de un lenguaje deja de ser efectiva. Parece ser, pues, que hay implicada una verdadera ventana de maduración.

Persistencia de esquemas no adaptativos: Escalas temporales

Una de las razones más comunes, y quizá la más simple, de la existencia de esquemas no adaptativos es que alguna vez, en condiciones que han dejado de prevalecer, fueron adaptativos. El entorno del sistema complejo adaptativo ha cambiado más rápidamente de lo que el proceso evolutivo puede responder (las ventanas de maduración son, en cierto sentido, un ejemplo extremo de tal desajuste de escalas temporales).

En el dominio del pensamiento humano, a menudo ocurre que nos enfrentamos a una situación rápidamente cambiante que supera nuestra capacidad para modificar nuestros esquemas mentales. Gerald Durrell, el fundador del zoo de la isla de Jersey, autor de tantos libros encantadores sobre sus expediciones en busca de animales raros, suele contar lo que le ocurrió una vez cuando sostenía cierta serpiente del África oriental en sus manos. No estaba tomando precauciones especiales porque «sabía» que la serpiente pertenecía a una especie ciega no peligrosa (como las culebras ciegas europeas). Súbitamente la serpiente abrió los ojos, pero Durrell no reaccionó con la suficiente rapidez ante la nueva información de que la serpiente pertenecía a una especie desconocida para él y posiblemente peligrosa. De hecho resultó ser venenosa, y Durrell fue mordido y estuvo a punto de morir.

Más que cambiar nuestro modo de pensar, tendemos a agarramos tenazmente a nuestros esquemas e incluso a distorsionar la nueva información para hacerla encajar en ellos. Hace muchos años, dos físicos del Centro de Física de Aspen pasaron la mañana escalando en las montañas de la región de Maroon Bells Wilderness. En el descenso, perdieron de vista sus marcas y fueron a parar a la cara sur de las montañas en vez de la cara norte, la más cercana a Aspen. Miraron el paisaje por debajo de ellos y vieron lo que identificaron como Crater Lake, que habrían tenido que divisar en el camino de vuelta a casa. Uno de ellos, sin embargo, reparó en que había un embarcadero que no estaba antes en el lago. El otro replicó: «Deben de haberlo construido después de pasar nosotros esta mañana». Esta desesperada defensa de un esquema fallido resultó ser, no hace falta decirlo, incorrecta. Los dos físicos estaban contemplando Avalanche Lake, y les llevó un par de días regresar a casa.

Caer en la cuenta de que la serpiente, una vez comprobado que no era ciega, podía ser venenosa se ajusta a nuestra descripción de tener una idea creativa en la vida diaria, escapando de una cuenca de atracción a otra. Y también pensar que era improbable que el lago, con su embarcadero, fuese Crater Lake y por lo tanto estaba en otra parte de las montañas. La presente discusión subraya el hecho de que el proceso de generación de tales ideas puede, en muchos casos, ir con retraso respecto de su necesidad.

Es notorio que las empresas a menudo tienen problemas para ajustar lo bastante deprisa sus prácticas a las condiciones cambiantes del mercado. Ahora mismo, en los Estados Unidos, la reducción de los presupuestos militares supone que las industrias hasta ahora dedicadas principalmente a la defensa tienen que darse prisa en encontrar clientes civiles. Las concepciones comerciales de muchas de estas industrias se han formado a lo largo de décadas de trato con las fuerzas armadas y las agencias gubernamentales relacionadas. El esquema dominante para la venta de un producto puede ser almorzar con un almirante, una táctica no necesariamente ganadora en la competencia civil. Por otro lado, los mecanismos para modificar tales esquemas y responder a las presiones selectivas a menudo necesitan muchos años para entrar en funcionamiento, mientras que la demanda de sistemas de defensa puede reducirse drásticamente en un año o dos. Si los antiguos ejecutivos (u otros nuevos que los reemplacen) no introducen nuevos mecanismos con un tiempo de respuesta menor, las perspectivas para sus empresas son poco optimistas.

El reto que representan unas circunstancias que cambian más rápidamente de lo que un determinado proceso evolutivo puede responder tiene una influencia profunda en las perspectivas para la biosfera y para la totalidad del género humano. La evolución cultural humana, especialmente a través de los avances en el terreno tecnológico, ha hecho posible en un breve lapso de tiempo una extraordinaria expansión de la población humana y de la capacidad de cada persona para afectar de modo adverso a otras personas y al medio ambiente. La evolución biológica, tanto en los humanos como en otros organismos, no puede seguir el ritmo. Nuestro propio esquema genético refleja en gran parte el mundo de hace 50 000 años y no puede, a través de los mecanismos normales de la evolución biológica, experimentar cambios importantes en unos pocos siglos. Igualmente, los otros organismos y las comunidades ecológicas al completo no pueden evolucionar con la suficiente rapidez para afrontar los cambios acarreados por la cultura humana.

La deducción es que el cambio cultural en sí mismo es la única esperanza para hacer frente a las consecuencias de una población humana gigantesca armada de una poderosa tecnología. Se requiere tanto una cooperación (junto con una competencia saludable) como una previsión sin precedentes para gestionar sabiamente las capacidades humanas. La necesidad de cooperación y previsión será incluso mayor si, para tratar algunos de los problemas más urgentes, la confianza se deposita en las transformaciones artificiales de seres humanos y otros organismos, por medio de futuros avances en ingeniería genética y otras técnicas.

Dada la inmensa complejidad de las numerosas cuestiones interrelacionadas que ha de afrontar la humanidad, la previsión exige identificar y recopilar grandes cantidades de información relevante, vislumbrar, gracias a esa información, las opciones ofrecidas por las ramificaciones alternativas de la historia futura, y seleccionar con juicio simplificaciones y aproximaciones que no sacrifiquen la representación de cuestiones cualitativas críticas, especialmente cuestiones de valores. La asistencia de ordenadores poderosos es esencial para la visión de futuro, pero no debemos dejar que su empleo desvíe la formulación de problemas hacia lo cuantificable y lo analizable a expensas de lo importante.

En este punto es conveniente echar una ojeada a los modelos simplificados de problemas complejos que los ordenadores pueden suministrar. Los ordenadores, actuando como sistemas complejos adaptativos, pueden servimos tanto aprendiendo como adaptándose, y modelando o simulando sistemas reales que aprenden, se adaptan o evolucionan.

Capítulo 20
Máquinas que aprenden o simulan aprendizaje

Los ordenadores pueden funcionar como sistemas complejos adaptativos. Puede tratarse de equipos especialmente diseñados o bien de ordenadores convencionales programados para aprender, adaptarse o evolucionar. Hasta ahora, la mayoría de diseños o programas intentan imitar de modo simplificado el funcionamiento de algunos sistemas complejos adaptativos vivientes.

Redes neuronales

Un tipo bien conocido de sistema complejo adaptativo informático es la red neuronal, que puede implementarse tanto en forma de programa como de circuito. Constituye una tosca analogía del funcionamiento del cerebro de un mamífero (especialmente el humano). Se parte de un conjunto de múltiples nodos o unidades (que suelen llamarse neuronas, aunque no está nada claro hasta qué punto se corresponden con las neuronas individuales de un cerebro vivo). En cada instante de tiempo, cada unidad está caracterizada por un bit (0 o 1) que se supone que indica si la «neurona» se ha disparado o no. Cada unidad está conectada con algunas o todas las otras, y la influencia ejercida por una unidad sobre otra es un número positivo si la primera unidad excita a la segunda, o negativo si la inhibe. Estos coeficientes cambian a medida que progresa el aprendizaje.

Las redes neuronales pueden hacerse funcionar en ordenadores convencionales; en ese caso un programa se hace cargo de la definición de las distintas unidades y de sus efectos excitadores o inhibidores sobre las otras. Las unidades existen sólo como elementos de computación. También es posible el empleo de equipos especiales para conformar la red, que entonces se compone de unidades separadas dispuestas en paralelo.

Un ejemplo de los muchos problemas a los que las redes neuronales han sido aplicadas es aprender a leer un texto en inglés en voz alta con una pronunciación correcta. Dado que existe una notable separación entre la ortografía y la fonética inglesas, este ejercicio no es en absoluto trivial. El ordenador tiene que descubrir un número enorme de reglas generales junto con sus excepciones, que pueden considerarse reglas especiales adicionales. Si se tiene un texto lo bastante largo, tanto las reglas generales como las especiales aparecerán un número de veces suficiente como para que se comporten como regularidades. Para que la red neuronal aprenda a leer en inglés en voz alta, tiene que funcionar como un sistema complejo adaptativo. Debe hacer diversas tentativas de identificación de conjuntos de regularidades en un bloque de texto, comprimir la información obtenida en esquemas y aplicar éstos a más texto, dejando que compitan entre sí para acercarse a la pronunciación correcta, que es facilitada por un «profesor». Esta clase de aprendizaje se denomina supervisado, en oposición, por ejemplo, a la clase de aprendizaje consistente en poner a prueba los esquemas de pronunciación ante angloparlantes para ver si entienden, pero sin la presencia de un profesor que facilite la respuesta correcta. La supervisión permite definir la adaptación en términos de la diferencia entre la pronunciación correcta de un texto y la pronunciación resultante del esquema.

En la red NETtalk, tal como fue desarrollada por Terry Sejnowski y C. R. Rosenberg en 1987, los datos de entrada consistían en siete caracteres consecutivos (cada uno de los cuales podía ser una de las 26 letras del alfabeto inglés, o bien un espacio, una coma o un punto) de algún texto escrito en inglés, presentado en una ventana móvil que recorría gradualmente el pasaje. La salida era un código de pronunciación para el carácter central de los siete; este código alimentaba un generador de voz.

Los datos de entrada se identificaban con los bits correspondientes a un conjunto de 7 veces 29 (= 203) unidades, y las salidas con los bits asociados a otras 26 unidades. Había otras 80 unidades adicionales para la asistencia en el aprendizaje. Los esquemas estaban representados por tablas de coeficientes de interacción, donde las interacciones se restringían a los efectos de las unidades de entrada sobre las unidades de ayuda y los de estas últimas sobre las unidades de salida. Todos los demás coeficientes de interacción se fijaron en cero para que el proceso resultara manejable.

La red fue adiestrada por medio de los caracteres que componían un texto de 1024 palabras, acompañado del «profesor», que era la secuencia de códigos de pronunciación de todos los caracteres, la cual daba la pronunciación correcta de la totalidad del texto.

En el primer recorrido de ensayo a través del texto, los coeficientes de interacción se inicializaban en valores arbitrarios y después cambiaban (en virtud de una suerte de aprendizaje) a medida que el centro de la ventana de siete letras se desplazaba letra a letra por el texto. En cada paso, los datos de entrada y los coeficientes alimentaban una fórmula simple que daba valores de salida que indicaban opciones de pronunciación posibles. La discrepancia entre los datos de salida candidatos y los correctos se reducía después modificando los coeficientes de interacción por medio de una fórmula simple. Los coeficientes de interacción al final de la primera pasada servían de inicio para una segunda pasada sobre el mismo texto de 1024 palabras. Y así sucesivamente.

El éxito implicaba que los coeficientes, en lugar de fluctuar ampliamente de un recorrido a otro, convergerían, con sólo desviaciones mínimas, hacia valores que darían una buena aproximación de la pronunciación correcta. Las pruebas mostraron que diez pasadas de adiestramiento sobre las 1024 palabras eran suficientes para dar una pronunciación inteligible, mientras que después de cincuenta pasadas se estimó que la pronunciación era correcta en un 95 por ciento. Tras el adiestramiento, los coeficientes resultantes se emplearon para pronunciar otro bloque de texto, esta vez sin profesor. Se consiguió una pronunciación inteligible con una precisión del 75 por ciento.

Hay muchas otras versiones de redes neuronales y una plétora de problemas a los que han sido aplicadas, a menudo con un éxito considerable. El esquema se representa siempre por una tabla de coeficientes de interacción, donde cada uno representa el efecto de una unidad sobre otra. Mi colega de Caltech John Hopfield señaló en 1982 una condición que, si se impone artificialmente sobre los coeficientes de interacción, permitiría no sólo que la adaptación estuviese bien definida, sino que aumentara sin interrupción durante el proceso de aprendizaje. Se requiere que el efecto de cualquier unidad A sobre otra B sea el mismo que el de B sobre A. Esta condición es casi con toda seguridad poco realista para cerebros reales, y también es violada por muchas redes neuronales exitosas, como la misma NETtalk. Aun así, resulta instructivo el hecho de que haya situaciones en las que la adaptación está bien definida y aumenta ininterrumpidamente y otras en las que no ocurre así.

Como siempre que la adaptación está bien definida, el proceso de aprendizaje consiste en la exploración de valles sobre un relieve adaptativo. Si además la adaptación aumenta sin interrupción, de modo que la altura de la superficie explorada siempre decrece, entonces vuelve a surgir el problema de quedarse atrapado en una depresión somera cuando hay pozos profundos cerca, lo que puede paliarse introduciendo ruido. Los coeficientes de interacción podrían alterarse ligeramente de vez en cuando de forma aleatoria. Estos cambios aleatorios en el esquema recuerdan los propuestos para sacar la mente del atolladero cuando uno persigue una idea creativa. Como siempre, existe un nivel de ruido óptimo.

Algoritmos genéticos como sistemas complejos adaptativos

Puesto que las redes neuronales se inspiran en una tosca analogía con el aprendizaje en los animales superiores, uno podría preguntarse si existen también sistemas complejos adaptativos de carácter informático inspirados en una analogía con la evolución biológica. Efectivamente así es. Los primeros fueron obra de John Holland, de la Universidad de Michigan, uno de los pilares del Instituto de Santa Fe, y hacen uso de un «algoritmo genético» y un «sistema de clasificación» especial, programados en un ordenador convencional. Hasta ahora, estos sistemas han sido empleados principalmente en problemas donde la adaptación está bien definida, como el diseño de estrategias para ganar a las damas o métodos para la instalación de cableados con un costo mínimo. Sin embargo, nada impide aplicarlos a otra clase de problemas.

Una descripción muy simplificada del algoritmo genético sería como sigue. Cada esquema es un programa para una estrategia o método posible. Cada programa se compone de cierto número de instrucciones. La variación entre esquemas consiste en cambiar estas instrucciones, por ejemplo haciendo que entre dos de ellas se produzca un entrecruzamiento (como se muestra en la Figura 23) análogo al que tiene lugar en la reproducción sexual de los seres vivos (ilustrado en la Figura 20). Las dos instrucciones se dividen por un cierto punto en un principio y un final. El entrecruzamiento hace surgir dos nuevas instrucciones, una de ellas compuesta por el principio de la primera vieja instrucción y el final de la segunda, y la otra por el principio de la segunda y el final de la primera.

023.jpg
Figura 23. Entrecruzamiento de instrucciones codificadas

La modificación de un programa mediante el reemplazamiento de una o más instrucciones por otras nuevas en la forma descrita mejora unas veces la adaptación del programa y otras la empeora. Sólo poniendo a prueba los diferentes programas el computador puede juzgar la bondad de cada modificación (la realización de este tipo de juicios difíciles es lo que se conoce como «concesión de crédito»). El sistema de clasificación de John Holland proporciona una especie de mercado donde las instrucciones en competencia son compradas y vendidas. Aquéllas que acreditan un mejoramiento en la ejecución de los programas alcanzan precios más altos que las que no mejoran o empeoran la ejecución. De este modo se establece una lista ordenada de instrucciones. En esta lista entran continuamente nuevas instrucciones, a la vez que las de la cola son borradas para hacerles sitio. Las instrucciones del principio de la lista son las empleadas en los programas modificados que constituyen los esquemas mutados.

Esto es sólo un burdo bosquejo de lo que en realidad es un procedimiento bastante sofisticado. Aun así, debería quedar claro que el resultado es la evolución de los programas, y que la adaptación tiende a aumentar en el curso de dicha evolución. El bucle retroactivo que se establece entre la ejecución de un programa y la promoción o degradación de las instrucciones que lo componen no es, sin embargo, rígido, sino una tendencia general afectada por las condiciones de mercado. Esto introduce suficiente ruido en el sistema para permitir la escapatoria de las cuencas de adaptación someras y el acceso a las profundidades cercanas. Lo típico es que el sistema explore un vasto espacio de métodos o estrategias posibles y no alcance un estado estacionario —un óptimo absoluto —. La estrategia óptima para jugar al ajedrez, por ejemplo, no se ha encontrado. Si el juego en cuestión fuera en cambio el tres en raya, la máquina pronto encontraría la mejor manera de jugar y la búsqueda terminaría.

Al igual que las redes neuronales, aunque el método del algoritmo genético ha sido aplicado principalmente a problemas de búsqueda y optimización donde la adaptación (o «coyuntura») está bien definida, también puede emplearse en otros ámbitos. Tanto las redes neuronales como los algoritmos genéticos constituyen sistemas complejos adaptativos de carácter informático que pueden desarrollar estrategias nunca diseñadas por un ser humano. Es natural preguntarse si hay algo especial en estas dos técnicas, sugeridas por vagas analogías con el funcionamiento cerebral y la evolución biológica respectivamente. ¿Puede inventarse otra técnica basada en una analogía con el sistema inmunitario de los mamíferos? ¿Existe de hecho un vasto pero bien definido conjunto de sistemas complejos adaptativos de carácter informático que incluya los ya conocidos o los hipotéticos, y muchos otros más? ¿Puede describirse tal categoría superior en términos prácticos, de modo que un usuario potencial pueda buscar entre los diferentes sistemas hasta encontrar uno apropiado para su problema?

Estas cuestiones son algunas de las que intentan responder los estudiosos de los sistemas complejos adaptativos informáticos.

Simulación de sistemas complejos adaptativos

El empleo de ordenadores en conexión con los sistemas complejos adaptativos no se reduce ni mucho menos al desarrollo de equipos o programas destinados a la creación de sistemas complejos adaptativos informáticos encaminados a la resolución de problemas. Otra vasta área de aplicaciones informáticas es la simulación del comportamiento de los sistemas complejos adaptativos.

El rasgo más sobresaliente de tales simulaciones es la emergencia de comportamientos complejos a partir de reglas simples. Estas reglas implican regularidades de carácter general, pero los casos individuales exhiben regularidades particulares añadidas. Esta situación es similar a la de la totalidad del universo, gobernado por leyes simples que permiten una infinidad de escenarios, cada uno de los cuales exhibe sus propias regularidades, especialmente para una región del espacio y un periodo determinados, de manera que a medida que pasa el tiempo pueden emerger cada vez más formas complejas.

Para diseñar una simulación manejable el truco consiste en reducir al máximo las reglas, pero de manera que no desaparezcan los comportamientos emergentes más interesantes. El diseñador de una simulación debe, pues, saber mucho sobre los efectos de los cambios en las reglas sobre el comportamiento del sistema en escenarios muy diversos. Algunos diseñadores, como Robert Axelrod, un experto en ciencias políticas de la Universidad de Michigan, han desarrollado una aguda intuición que les permite adivinar cómo simplificar sin tirar al niño junto con el agua del baño. Naturalmente, esta intuición se basa en parte en un razonamiento a priori y en parte en la experiencia de jugar con las reglas y ver qué pasa luego. De hecho, el diseño de simulaciones simples pero ricas en consecuencias interesantes tiene más de arte que de ciencia.

¿Puede hacerse más científico el estudio de conjuntos de reglas y de sus consecuencias? Se requeriría una experiencia adicional, junto con la formulación de las intuiciones empíricas sobre qué clases de reglas conducen a qué modos de comportamiento. Después podrían conjeturarse teoremas rigurosos y por último algunos de estos teoremas podrían ser demostrados, presumiblemente por matemáticos.

De esta manera podría emerger una ciencia de las reglas y sus consecuencias, donde los experimentos serían las ejecuciones de programas y los teoremas demostrados constituirían el cuerpo de teoría. De hecho, con el advenimiento de ordenadores rápidos y poderosos se están realizando cada vez más simulaciones sencillas sobre cada vez más temas. La materia prima para la ciencia futura ya se está recopilando.

Pero en última instancia lo que de verdad importa es la relevancia de las simulaciones respecto de las situaciones reales que remedan. ¿Proporcionan las simulaciones intuiciones valiosas sobre situaciones reales? ¿Sugieren conjeturas que podrían verificarse mediante la observación? ¿Revelan posibles comportamientos antes insospechados? ¿Indican nuevas explicaciones posibles de fenómenos ya conocidos?

En la mayoría de campos las simulaciones son todavía demasiado primitivas para responder afirmativamente a estas preguntas. De todos modos, es asombroso comprobar cómo, en ciertos casos, un conjunto de reglas muy simple puede dar idea del funcionamiento de un sistema complejo adaptativo en el mundo real.

Una simulación de la evolución biológica

Un espléndido ejemplo es el programa TIERRA, escrito por Thomas Ray, un ecólogo de la Universidad de Delaware adscrito al Instituto de Santa Fe. Ray trabajaba en las selvas bajas de Costa Rica, en la estación de investigación biológica de La Selva. Se sintió atraído por la investigación ecológica porque quería dedicarse al estudio de la evolución. Desafortunadamente, poca evolución biológica tiene lugar en el lapso de una vida humana, lo que hizo que su campo de trabajo comenzara a parecerle frustrante. Así pues, decidió simular la evolución en un computador.

Inicialmente planeó el desarrollo de su programa en etapas, comenzando con uno supersimplificado al que se le añadirían progresivamente nuevos rasgos, como el equilibrio puntuado o la existencia de parasitismo. Tras un penoso aprendizaje autodidacta consiguió escribir y depurar un primer programa muy simple en «lenguaje máquina». Este programa inicial se llamó TIERRA, y ha resultado ser de una riqueza extraordinaria, pues Tom ha estado ocupado en el mismo desde entonces. Más aún, ciertos rasgos que él había planeado introducir más tarde, incluidos el equilibrio puntuado y el parasitismo, surgieron espontáneamente de TIERRA. El programa incluso produjo algo muy semejante al sexo.

TIERRA se vale de «organismos digitales», que son secuencias de instrucciones en código máquina que compiten por un espacio en la memoria del ordenador y por tiempo en la unidad central de proceso, de la que se sirven para su autorreplicación. En cierto sentido, la comunidad de sistemas complejos adaptativos proporcionada por TIERRA es degenerada, porque el genotipo y el fenotipo de cada organismo digital están representados por el mismo objeto, a saber, la secuencia de instrucciones. Esta secuencia es lo que experimenta mutaciones y es afectado por las presiones selectivas en el mundo real. De todas maneras, es conveniente (como ha sido remarcado por Walter Fontana) mantener una separación mental entre las dos funciones aunque ambas corran a cargo de la misma entidad. (De acuerdo con algunas teorías sobre el origen de la vida, una etapa temprana del proceso habría tenido el mismo carácter degenerado, con el ARN asumiendo el papel tanto de genotipo como de fenotipo.)

Las mutaciones se introducen de dos maneras. En primer lugar, de vez en cuando los bits cambian (de 0 a 1 o viceversa) al azar en cualquier parte del conjunto de organismos (lo que se parece mucho al modo en que los rayos cósmicos afectan a los organismos reales), a una tasa de alrededor de un bit por cada 10 000 instrucciones ejecutadas. En segundo lugar, en el curso de la replicación de los organismos digitales, los bits cambian al azar en las copias. Aquí la tasa es algo mayor, alrededor de un bit por cada 2000 instrucciones copiadas. Éstas son tasas promedio; los errores se distribuyen irregularmente en el tiempo para evitar periodicidades artificiosas.

La importancia de la muerte en biología no fue descuidada en el diseño de TIERRA. La capacidad de la memoria está severamente limitada, y en ausencia de muerte las criaturas autorreplicantes pronto la llenan, no dejando espacio para ulteriores replicaciones. De ahí el «segador», que elimina organismos regularmente según una regla que depende de la edad del organismo y de los errores cometidos por el mismo en la ejecución de ciertas instrucciones.

Tom Ray diseñó una secuencia autorreplicante de ochenta instrucciones que sirve siempre de ancestro —el organismo digital inicial— en cualquier ejecución de TIERRA. Cuando ejecutó el programa por primera vez esperaba un largo período subsiguiente de refinamiento del mismo, pero enseguida comenzaron a surgir resultados interesantes, muchos de los cuales sugerían fenómenos biológicos reales, y esta situación se ha mantenido desde entonces.

Una misteriosa novedad fue la aparición, tras un largo período de evolución, de una versión refinada del ancestro, que constaba únicamente de treinta y seis instrucciones, pero en cambio contenía un algoritmo más complejo. Cuando Tom le enseñó esta versión optimizada a un informático, éste le dijo que era un ejemplo de una conocida técnica llamada «desrizar el rizo». En TIERRA, la evolución había resuelto el problema de desrizar el rizo. Tom escribe: «La optimización es una técnica muy ingeniosa inventada por los humanos. Pero es implementada en un estilo desordenado aunque funcional que ningún humano usaría (a menos que estuviese muy borracho)».

¿De dónde salen estos organismos con un número de instrucciones distinto de ochenta? Las mutaciones no pueden producirlos directamente. Inicialmente, el sistema contiene sólo el ancestro y sus descendientes de ochenta instrucciones (que se multiplican hasta que la memoria está casi repleta, momento en que el segador comienza a trabajar; luego la población cambiante de organismos continúa ocupando casi toda la memoria). Finalmente aparecen mutaciones que alteran el genotipo de un organismo de ochenta instrucciones de un modo especial: cuando el organismo se examina a sí mismo para determinar su talla y transferirla a sus descendientes, se produce una respuesta incorrecta y se transfiere una nueva talla. De este modo, la población comienza a albergar organismos de tallas muy diferentes.

Si el primer intento de modelar la evolución biológica por este camino ha dado tantos frutos, sin duda debe haber un enorme territorio todavía por explorar. Nuevas maneras de simular cómo la evolución, operando sobre enormes períodos de tiempo, ha generado la información ahora almacenada en los organismos y las comunidades naturales de todo el mundo pueden ayudarnos no sólo a mejorar nuestra comprensión de la diversidad existente, sino a crear un clima intelectual en el que esa diversidad pueda ser mejor protegida.

Una herramienta para la enseñanza de la evolución

El programa TIERRA, junto con otras simulaciones informáticas de la evolución biológica que puedan desarrollarse en el futuro, será especialmente valioso para que los no científicos puedan apreciar cómo funciona la evolución. A la mayoría de gente no le resulta difícil comprender, incluso sin simulaciones, cómo variaciones relativamente pequeñas combinadas con unas pocas generaciones de selección pueden producir cambios en una población. La experiencia personal con la cría de perros, periquitos, caballos o rosas puede convencer fácilmente a casi todo el mundo de la realidad de la evolución a pequeña escala. Pero la evolución a gran escala, con la aparición de nuevas especies, géneros, familias e incluso taxones superiores, es otra cosa. Hasta el relativamente cercano parentesco del elefante con el damán es duro de roer para la mayoría de gente. Todavía es más difícil visualizar la interrelación entre todas las formas de vida, incluyendo los inmensos cambios que pueden producirse en el transcurso de miles de millones de años.

Lo que para mucha gente resulta especialmente difícil de aceptar es que el azar más las presiones selectivas puedan conducir de una condición inicial simple a formas altamente complejas y a las comunidades ecológicas que las contienen. No pueden creer que tal evolución pueda tener lugar sin alguna clase de guía o designio. (Otros se resisten especialmente a la evolución de la conciencia, de la que los humanos nos sentimos tan orgullosos; creen que la conciencia no puede surgir de otra cosa que no sea una conciencia preexistente.) Dado que nunca he albergado dudas de esta clase, sólo puedo contemplarlas desde fuera. Pero para mí está claro que una manera de superarlas es dejar que la gente experimente las notables transformaciones efectuadas por millones de generaciones de procesos fundamentalmente aleatorios combinados con la selección natural. Esto sólo puede conseguirse por medio de la simulación, como en TIERRA, que puede recorrer un enorme número de generaciones en un período de tiempo razonable, y en simulaciones más sofisticadas y realistas que estarán disponibles en el futuro.

Al describir la evolución biológica en términos de azar y selección, estamos tratando los diversos procesos de mutación, por simplicidad, como si fueran puramente estocásticos. Pero de hecho podrían apartarse algo del puro azar. Varios autores citan observaciones que sugieren que las mutaciones surgen a veces de forma no aleatoria, incluso de maneras que parecen favorecer una adaptación creciente. Pero la posible existencia de efectos ocasionales de esta clase no altera la cuestión fundamental, es decir, que en ausencia de tales cambios ocasionales no aleatorios la evolución biológica procedería, hasta donde sabemos, tal como lo hace ahora.

Antes de que Tom Ray desarrollase el programa TIERRA, convoqué a un pequeño grupo de pensadores en el Instituto de Santa Fe para discutir la posibilidad de inventar un juego de ordenador que pudiera popularizarse y convenciese a los jugadores del inmenso poder del proceso evolutivo al abarcar un gran número de generaciones. Un excelente resultado del encuentro fue que, de vuelta a casa, John Holland inventó ECHO, una rica simulación por ordenador de una ecología de organismos simples. Pero la idea del juego didáctico no prosperó. Luego, al poco tiempo y de manera independiente, llegó Tom Ray con su TIERRA, que, aunque no se trata en realidad de un juego, puede en última instancia hacer la misma función.

Algunos de los participantes en el encuentro me indicaron que un bolsillo en la tapa de la primera edición del libro de Richard Dawkins El relojero ciego contenía el programa de un juego de ordenador ilustrativo de la evolución. Pero aquella clase de juego no era exactamente lo que yo tenía en mente. La cuestión es que en la evolución biológica no hay ningún diseñador en el bucle. Pero Dawkins, cuyo libro está dedicado a dejar claro este punto de una manera elegante, inventó un juego en el que el jugador introduce las presiones selectivas a medida que procede la evolución, de modo muy parecido al usuario del programa de Karl Sims p ara producir cuadros (el juego viene con una opción que deja a los organismos evolucionar solos, pero faltan las presiones selectivas procedentes de la comunidad ecológica a la que pertenecen). Utilizando el (sólo parcialmente justificado) lenguaje de la adaptación, se puede decir que en el juego de Dawkins la adaptación es exógena, inducida desde fuera, mientras que en la naturaleza la adaptación es endógena, determinada en última instancia, sin interferencias externas, por el carácter de la Tierra y el Sol y por sucesos aleatorios que incluyen la evolución de un enorme número de especies particulares. ¿Puede diseñarse un juego en el que los jugadores, como Tom Ray con TIERRA, aporten sólo una situación inicial y un conjunto de reglas evolutivas, y el azar y la selección natural hagan el resto?

Simulación de colectivos de agentes adaptativos

Cualquier simulación evolutiva seria debe incluir la interacción entre poblaciones pertenecientes a numerosas especies; el medio ambiente de cada una de ellas comprende, además del entorno fisicoquímico, todos los otros organismos. Pero si lo que queremos es comprender qué ocurre con una comunidad ecológica tal en un periodo de tiempo lo bastante corto como para que los cambios evolutivos carezcan de importancia, entonces tenemos que simular un proceso ecológico.

Unos cuantos teóricos asociados al Instituto de Santa Fe han empleado modelos de ordenador para estudiar las propiedades de aquellos sistemas complejos adaptativos formados por colectivos de agentes adaptativos, los cuales elaboran esquemas para describir y predecir el comportamiento mutuo. Estos investigadores han reunido un cuerpo de conocimientos sobre dichos sistemas, que incluye tanto conjeturas plausibles como resultados demostrados para modelos particulares. El cuadro resultante es tal que la región de contenido de información algorítmica intermedio, entre el orden y el desorden, es posible que contenga un régimen que recuerda el de la criticalidad autoorganizada, ejemplificado por los montones de arena, en el cual podría haber magnitudes clave distribuidas según leyes potenciales. Y lo más importante de todo, la totalidad del sistema podría tender a evolucionar hacia la condición en que se aplican dichas leyes potenciales.

Stuart Kauffman ha llevado a cabo una buena cantidad de estudios teóricos sobre este tema, lo mismo que Per Bak. Stuart está entre quienes lo describen como «adaptación hacia el límite del caos», donde «límite del caos» se emplea aquí en un sentido algo metafórico para indicar una condición crítica entre el orden y el desorden. La expresión entera, ahora extendida en la literatura popular, fue acuñada por Norman Packard como título de un artículo sobre la aproximación a dicha condición crítica por parte de un sistema informático de aprendizaje muy simple. Por la misma época Chris Langton llevó a cabo investigaciones parecidas de forma independiente.

En los dominios ecológico y económico, donde hay aplicaciones obvias, las leyes potenciales mencionadas son bien conocidas a partir de las observaciones, en particular las que gobiernan la distribución de recursos. La conocida ley empírica de la distribución de los salarios en una economía de mercado, descubierta el siglo pasado por el economista italiano Vilfredo Pareto, se aproxima a una ley potencial para los sueldos más altos. Pareto descubrió también una ley potencial aproximada para la riqueza individual, otra vez aplicable al extremo superior del espectro.

Los ecólogos suelen fijarse en la fracción de los recursos utilizada por la totalidad de individuos de una especie dada, considerada como una función de las diversas especies de la comunidad. Aquí vuelven a aparecer las leyes potenciales empíricas. Por ejemplo, a lo largo de las costas rocosas del mar de Cortés, cerca de su extremo norte justo al sur de la orilla estadounidense, la zona intermareal contiene cierto número de organismos, como las bellotas de mar y los mejillones, que ocupan una proporción variable del área superficial de las rocas. El área total ocupada por cada especie obedece, con muy buena aproximación, a una ley potencial. Estos habitantes de las rocas son depredados por otras criaturas. Entre ellas, en lo más alto de la cadena trófica, está la estrella de mar de 22 brazos (Heliaster kubniji). ¿Qué pasaría si se eliminase la estrella del cuadro general? De hecho esto es lo que ocurrió, a causa de alguna catástrofe, en una cierta extensión de costa, y los ecólogos pudieron observar las consecuencias. El resultado fue un reajuste del sistema formado por los organismos restantes, con nuevos valores para el área total de roca cubierta por cada especie. Sin embargo, la ley potencial aproximada todavía regía. Esto podría dar un cierto soporte empírico a la idea de que los sistemas de agentes coadaptados son atraídos hacia una especie de régimen de transición caracterizado por leyes potenciales para la distribución de recursos.

Matemática basada en leyes y matemática basada en agentes

En buena parte de la investigación actual sobre los sistemas complejos adaptativos las matemáticas tienen un papel muy significativo, pero la mayoría de las veces no se trata de la clase de matemáticas que tradicionalmente predomina en la teoría científica. Supongamos que el problema consiste en la evolución temporal de un sistema tal que en cada momento su estado cambia de acuerdo con cierta ley. Muchos de los éxitos más sonados de la teoría científica se han conseguido gracias a la matemática continua, donde la variable tiempo es continua y también lo son las variables que describen el estado del sistema. Dicho estado cambia en cada momento de acuerdo con una ley expresada en términos de las variables continuas que caracterizan el sistema. En lenguaje técnico, se dice que la evolución temporal del sistema está descrita por una ecuación diferencial o un conjunto de ellas. Gran parte de los progresos en física fundamental durante los últimos siglos se fundamentan en leyes de esta clase, incluidas las ecuaciones de Maxwell para el electromagnetismo, las ecuaciones de Einstein para la gravitación en el marco de la relatividad general y la ecuación de Schrödinger para la mecánica cuántica.

Cuando estas ecuaciones se resuelven con la ayuda de un ordenador digital, lo normal es aproximar la variable continua tiempo mediante lo que se llama una variable discreta, que toma valores separados por intervalos finitos en vez de todos los valores posibles entre los instantes inicial y final que limitan el período de tiempo objeto de estudio. También las variables continuas que caracterizan el estado del sistema se aproximan mediante variables discretas. La ecuación diferencial es reemplazada por una ecuación en diferencias finitas. A medida que se reducen los intervalos entre valores contiguos de las variables discretas, tiempo incluido, la ecuación en diferencias se parece más a la ecuación diferencial que sustituye, y el ordenador digital se acerca más a la solución del problema original.

En la simulación de sistemas complejos adaptativos suele emplearse una matemática discreta semejante a la que sirve para aproximar ecuaciones diferenciales continuas en un ordenador digital, pero aquí la matemática discreta no constituye una aproximación, sino que es fundamental en sí misma. Las variables que describen el estado del sistema pueden tomar sólo algunos valores, que representan diferentes alternativas. (Por ejemplo, un organismo puede o no comerse a otro, o dos organismos pueden o no entrar en combate y, si lo hacen, puede ganar uno u otro, o un inversor puede comprar, vender o guardar acciones.)

Incluso la variable tiempo puede tomar sólo unos pocos miles de valores que representen, por ejemplo, generaciones o transacciones comerciales, según el tipo de problema. Además, en muchos problemas los cambios que experimenta el sistema en cada uno de esos instantes están determinados por una ley que depende no sólo del estado del sistema en un momento dado, sino también del resultado de un proceso estocástico.

De la clase de matemática discreta que hemos estado discutiendo suele decirse que es una matemática basada en leyes. Es una matemática natural para los ordenadores digitales, y a menudo se aplica a la simulación de sistemas complejos adaptativos compuestos por multitud de agentes individuales, cada uno de ellos un sistema complejo adaptativo a su vez. Típicamente, los agentes — como los organismos en una comunidad ecológica o los individuos y negocios en un sistema económico— desarrollan esquemas que describen el comportamiento de otros agentes y la manera de reaccionar ante él. En tales casos, la matemática basada en leyes se convierte en una matemática basada en agentes, como ocurre, por ejemplo, en el programa TIERRA.

Hacia una economía menos sombría

Los ejercicios con matemáticas basadas en agentes están entre las herramientas recientes empleadas para guiar a los economistas hacia una aproximación más evolucionista. Una gran parte de la economía teórica de las últimas décadas se ha caracterizado por una preocupación por una especie de equilibrio ideal basado en mercados perfectos, información perfecta y agentes perfectamente racionales, a pesar de los esfuerzos de algunos de los mejores economistas para incorporar imperfecciones en estas tres categorías dentro de la síntesis neoclásica posterior a la segunda guerra mundial.

Según una vieja historia que circula entre los economistas, un teórico neoclásico y su educada nietecita estaban paseando por la calle en una gran ciudad norteamericana. La niña vio un billete de veinte dólares en el suelo y, como era muy formal, preguntó a su abuelo si podía cogerlo. «No, cariño», replicó él, «si fuera auténtico ya lo habría cogido alguien».

Desde hace algunos años, un puñado de estudiosos, incluidos los miembros de un grupo interdisciplinario reunido por el Instituto de Santa Fe, han dirigido sus esfuerzos hacia el estudio de las economías como sistemas complejos adaptativos en evolución, compuestos por agentes adaptativos económicos dotados de una racionalidad limitada, con información imperfecta y actuando fundamentalmente al azar y en función de la percepción de los propios intereses económicos. Las felices predicciones de la teoría del equilibrio aparecen entonces únicamente como aproximaciones, mientras que la nueva aproximación admite fluctuaciones en torno a dichas predicciones, lo que se ajusta mejor a la realidad.

En un modelo sumamente simple desarrollado por Brian Arthur. John Holland y Richard Palmer (un físico de la Universidad de Duke adscrito al Instituto de Santa Fe), los inversionistas, de una sola clase, están representados por agentes adaptativos que tratan los unos con los otros a través de una cámara de compensación. Cada acción rinde unos dividendos anuales que pueden variar de manera arbitraria. El tipo de interés anual es una constante, y la razón entre beneficio e interés determina, más o menos, el valor fundamental de la acción. Pero el precio real puede desviarse mucho del valor fundamental. Cada agente elabora esquemas elementales basados en la historia de los precios de las acciones, los cuales les dicen cuándo comprar, guardar o vender. En cualquier momento, los distintos agentes pueden estar haciendo uso de esquemas diferentes. Además, un agente dado puede tener una lista de esquemas y pasar de uno a otro según vayan las cosas. De este modo se generan fluctuaciones en los precios, a menudo exageradas y ligadas a alzas y bajas repentinas de carácter especulativo, añadidas a un valor fundamental lentamente cambiante que representa una especie de límite inferior poco definido para la desigual curva de precios en función del tiempo. Tales fluctuaciones, reminiscencias de lo que pasa en los mercados reales, surgen aquí de un modelo evolutivo que trata con agentes que distan de la perfección pero intentan mantenerse informados.

Algunos de los participantes en el movimiento para la reforma económica han demostrado que la racionalidad perfecta no sólo está en clara contradicción con los asuntos humanos, sino que es inconsistente con cualquier situación en la que se den fluctuaciones de mercado. Personalmente siempre me ha causado asombro la tendencia de tantos psicólogos, economistas y hasta antropólogos académicos a tratar a los seres humanos como entes absolutamente racionales, o casi. Mi propia experiencia, sea por introspección o por observación del comportamiento ajeno, me dice que la racionalidad es sólo uno de los muchos factores que gobiernan la conducta humana, y de ningún modo es siempre el principal. Asumir que los seres humanos son racionales a menudo facilita la construcción de teorías sobre su modo de actuación, pero tales teorías suelen ser poco realistas. Aquí, ¡ay!, reside la principal debilidad de muchas de las teorías actuales en ciencias sociales y del comportamiento. Cuando se trata de construir teorías sobre fenómenos complejos, el hacerlas más analizables puede resultar conveniente, pero no necesariamente las hace mejores a la hora de describir los fenómenos —y muy bien puede hacerlas mucho peores.

En mi opinión, la gran contribución de la teoría económica a la comprensión de los asuntos humanos es simplemente el repetido énfasis en los incentivos. En cualquier situación, ¿cuáles son los incentivos para las diferentes líneas de acción? Cuando los primeros manuscritos del mar Muerto fueron descubiertos y los despistados arqueólogos, en su afán por conseguir más trozos de pergamino, ofrecieron a los nómadas árabes una retribución fija por cada fragmento encontrado, estaban propiciando que las piezas fuesen hechas pedazos antes de ser entregadas. Los economistas estudian, a menudo de manera sofisticada, cómo actúan los incentivos en el seno de la sociedad, poniendo de manifiesto las debilidades en los sucesivos esquemas de gobierno o de gestión, análogas a las del sistema de retribución en el caso de los manuscritos del mar Muerto. Los incentivos representan presiones selectivas en el seno de un sistema económico. Aun cuando las respuestas a los mismos no sean completamente racionales, y aunque haya otras presiones en liza, los incentivos económicos contribuyen a determinar qué esquemas de comportamiento económico prevalecerán. El ingenio humano siempre se las arreglará para aprovecharse de los incentivos existentes, igual que la evolución biológica casi siempre acaba por llenar algún nicho ecológico vacante. El enfoque evolucionista de la economía, junto con el reconocimiento de la racionalidad limitada de los seres humanos, no puede sino mejorar las intuiciones de los economistas acerca de cómo operan los incentivos.

El programa económico ha sido una de las actividades más fructíferas del Instituto de Santa Fe, al estimular nuevos trabajos teóricos y modelizaciones de alta calidad. Naturalmente, como en toda ciencia teórica, el éxito debe medirse en última instancia por las explicaciones de los datos existentes y por las predicciones correctas de los resultados de futuras observaciones. El Instituto es todavía muy joven y los problemas que se estudian en él demasiado difíciles para que se obtengan éxitos espectaculares a corto plazo. Los próximos años serán críticos para juzgar la obra del Instituto, y es probable que los modelos económicos hayan dado como fruto la verificación de algunas predicciones.

Sin embargo, hay otras reformas muy necesarias en teoría económica. Algunas tentativas fueron contempladas en el plan original del programa económico del Instituto, pero todavía no se han puesto en marcha. Una cuestión vital es cómo tener en cuenta de forma apropiada valores difíciles de cuantificar.

Los economistas han sido a veces satirizados como gente que mediría el valor del amor a partir del precio de la prostitución. El valor de algunas cosas es fácil de calcular en dinero, y la tentación de tener en cuenta sólo tales cosas e ignorar todo lo demás en los cálculos de costes y beneficios es fuerte. Si se propone la construcción de una presa, un análisis clásico de costes y beneficios tendría en cuenta cosas como la energía eléctrica y el control del caudal. Por otra parte, al embalse resultante se le puede asignar un valor recreativo medido por el valor de los clubs náuticos y puertos que se construirán para acoger las embarcaciones. Es posible que en el debe del proyecto se cuente el coste de las casas que quedarán inundadas por el embalse, pero no así el valor de las plantas y animales del valle, ni el valor histórico que pueda tener el mismo, ni los lazos comunales que serán destruidos. Es difícil asignar un valor monetario a tales cosas.

La aparentemente insensible práctica de ignorar lo que es difícil de cuantificar suele atribuirse a una falta de valores. Pero en realidad es todo lo contrario, pues representa la imposición sobre cualquier análisis de un rígido sistema de valores que favorece aquellos que son fácilmente cuantificables sobre otros que son más delicados pero que, en cambio, quizá sean más importantes. Las decisiones basadas en esta manera de pensar empobrecen nuestras vidas. Muchos economistas y expertos en ciencias políticas han recomendado no considerar valores no cuantificables en el proceso político. Pero si se hace esto, todos los estudios cuantitativos, con sus cálculos precisos de lo que pasa con los valores fácilmente cuantificables, tienen que ser sopesados por quienes toman las decisiones frente a argumentos cualitativos a los que no se les puede asignar un número. Hoy día está ganando terreno la idea de consultar a la gente para comprobar qué valor asignaría a cosas como un mejoramiento de la calidad del aire, la preservación de un parque o el mantenimiento de las relaciones con el vecindario. En teoría económica, las preferencias de la gente suelen tratarse como cosas bien definidas y fijadas. Éste es un punto de vista en armonía con los ideales democráticos. Pero el destino del planeta ¿es sólo un asunto de opinión pública? ¿No tiene la ciencia algo que ofrecer?

La ciencia natural tendría que ser especialmente relevante cuando los cambios se contemplan como irreversibles o casi irreversibles. T al como está formulada en el presente, ¿presta la economía suficiente atención a la irreversibilidad? En física, la primera ley de la termodinámica establece la conservación de la energía total, y seguir la pista de la energía en física se parece al proceso de seguir la pista del dinero en economía. Ahora bien, ¿dónde está el análogo económico de la segunda ley de la termodinámica, la tendencia de la entropía a aumentar (o no cambiar) en un sistema cerrado? La entropía sirve para definir la irreversibilidad en física, y muchos pensadores han intentado definir la noción correspondiente en economía, hasta ahora sin un éxito claro. Pero quizá la búsqueda no sea infructuosa después de todo, pues podría servir para enmendar la extendida idea de que cualquier cosa que se esté agotando puede reemplazarse por algún sustitutivo, como árboles de plástico.

Mientras tanto, los economistas más destacados han desarrollado conceptos encaminados a corregir el planteamiento de tener en cuenta sólo las cosas fácilmente convertibles en dinero. La noción de «retribución psíquica» considera el hecho de que la gente obtiene satisfacción, y por lo tanto puede sentirse pagada, con cosas intangibles, como el orgullo de ayudar a los demás. El «coste de la información» tiene en cuenta el hecho de que la gente puede no saber cómo tomar decisiones razonables en un mercado libre (por ejemplo sobre compras) si no tiene la necesaria experiencia o intuición. La «tasa social de depreciación» se supone que considera la deuda entre generaciones —el grado en que una generación determinada deprecia el futuro está relacionado con cuánto planea dejar a las generaciones que le sucederán.

Sin embargo, para los economistas que trabajan en los negocios, el gobierno y las agencias internacionales, puede que no sea fácil incluir conceptos tan avanzados en sus informes y recomendaciones. Más aún, puede ser muy difícil cuantificar algunos de estos conceptos aunque hayan sido introducidos en la teoría.

En conclusión, tanto en la teoría como en la práctica parece haber espacio para mejorar el tratamiento económico de valores difícilmente cuantificables, especialmente en casos donde estos valores están en peligro de desaparecer irreversiblemente. Los progresos que se hagan pueden ser particularmente valiosos para la preservación de la diversidad biológica y cultural.

Parte IV
Diversidad y sostenibilidad
 

Capítulo 21
Diversidades en peligro

Hemos examinado cómo unas leyes simples, que incluyen un estado inicial ordenado, junto con la intervención del azar, han producido las maravillosas complejidades del universo. Hemos visto cómo, cuando los sistemas complejos adaptativos se establecen, funcionan a través del ciclo de esquemas variables, circunstancias accidentales, consecuencias fenotípicas y retroacción de las presiones selectivas sobre la competencia entre esquemas. Tienden a explorar un enorme espacio de posibilidades, con aperturas hacia niveles superiores de complejidad asociados a la generación de nuevas clases de sistema complejo adaptativo. A lo largo de extensos períodos de tiempo, destilan, a partir de sus experiencias, una notable cantidad de información, caracterizada tanto por su complejidad como por su profundidad.

La información almacenada en tales sistemas en cualquier momento incluye contribuciones de toda su historia anterior. Esto es así en el caso de la evolución biológica, que ha progresado durante 4000 millones de años, y también en el de la evolución cultural del Homo sapiens sapiens, que ha durado unos 100 000 años. En este capítulo trataremos algunos de los problemas y dilemas que plantea la preservación de al menos una buena parte de la diversidad que estos dos tipos de evolución han generado.

En contraste con los capítulos previos, aquí el énfasis se pondrá más en actuaciones y políticas que en el conocimiento por sí mismo. Por lo mismo, el discurso será más el de un abogado que el de un erudito. En el capítulo siguiente, nos trasladaremos al amplio marco dentro del cual se perseguiría un futuro sostenible y deseable, y veremos cómo podría estudiarse dicho marco.

Aunque buena parte de nuestra discusión se centrará en la ciencia y el saber, y en el papel de los expertos, hay que tener en mente que los intentos de imponer a las sociedades humanas soluciones desde arriba suelen tener consecuencias destructivas a largo plazo. Sólo a través de la educación, la participación, cierto grado de consenso y la percepción generalizada por parte de los individuos de estar personalmente comprometidos en la empresa, puede conseguirse un cambio duradero y satisfactorio.

La conservación de la diversidad biológica

Hemos mencionado la importancia de transmitir a todo el mundo (por ejemplo a través de la simulación por ordenador) una apreciación de cómo un único ancestro podría dar lugar, a través de la transmisión de errores y la recombinación genética, acompañadas de la selección natural, a la complejidad efectiva representada por la asombrosa diversidad de formas de vida existentes en la actualidad. Estas formas de vida contienen una extraordinaria cantidad de información, acumulada en un período de tiempo de magnitud geológica, sobre modos de vida en el planeta Tierra y modos de relación mutua entre las diferentes formas de vida. ¡Cuán poco de toda esta información ha sido recopilado hasta ahora por los seres humanos!

Pero los humanos, a través de la procreación combinada con un elevado impacto ambiental por persona (especialmente por persona rica), han dado inicio a un episodio de extinción que podría acabar siendo comparable en destructividad con alguna de las grandes extinciones del pasado. ¿Tiene algún sentido destruir en unas pocas décadas una fracción importante de la complejidad que la evolución ha creado en tan largo período?

¿Vamos a comportamos los humanos como muchos otros animales que, en respuesta a un imperativo biológico, ocupan todos los rincones y grietas disponibles, hasta que su población se ve limitada por el hambre, las enfermedades y las peleas? ¿O vamos a hacer uso de la inteligencia que, como tanto nos gusta presumir, distingue nuestra especie de las demás?

La conservación de la diversidad biológica es una de las tareas más importantes que afronta la humanidad cuando se acerca el final del siglo XX. En la empresa están comprometidas gentes de toda condición y de todo el mundo, aplicando diversos métodos para decidir qué hay que hacer y sobre todo qué hay que hacer primero. Aunque las prioridades variarán de un sitio a otro, hay algunos principios y prácticas que pueden ser de aplicación muy general.

La importancia de los trópicos

Es en los trópicos (especialmente en tierra firme) donde los esfuerzos de conservación se hacen más necesarios. Allí existe la mayor diversidad de especies y también la mayor presión sobre los recursos naturales para cubrir las necesidades de una población humana pobre y en rápido crecimiento. Esta conjunción —más que perder y más peligro de pérdida— hace que la conservación biológica de los trópicos sea especialmente urgente.

Los trópicos son diferentes de las zonas templadas no sólo por el número de especies amenazadas, sino también por lo poco que se sabe de ellas. En las latitudes templadas es posible en general definir las necesidades de conservación observando especies individuales (al menos las plantas y animales «superiores») y determinando cuáles se encuentran en dificultades a escala local, nacional o mundial. Cuando, como debe ser, se consideran los biomas (las comunidades ecológicas), pueden definirse como asociaciones de especies conocidas.

En los trópicos, en cambio, numerosas especies son todavía desconocidas para la ciencia y algunos biomas apenas han sido explorados. En estas condiciones es impracticable, como norma, establecer los objetivos de conservación en términos de especies. En vez de eso uno tiene que concentrarse en salvar sistemas representativos en los que estén representadas las especies individuales, y la definición de estos sistemas no siempre es fácil.

El papel de la ciencia

La ciencia tiene un papel crucial en la conservación de los trópicos. Esto resulta especialmente claro si recordamos que el objetivo de la ciencia no es sólo acumular hechos, sino aumentar la comprensión descubriendo estructuras (esto es, regularidades) en la información y también, siempre que sea posible, mecanismos (explicaciones dinámicas) para los fenómenos.

Hay toda una gama de métodos disponibles para recopilar, organizar e interpretar datos sobre el estado de las comunidades naturales de los trópicos. Los biólogos sistemáticos (aquellos que estudian la clasificación y distribución de plantas y animales) se inclinan por los estudios a largo plazo, que pueden prolongarse durante muchas décadas y rinden conocimientos que tendrán importancia al cabo de largo tiempo. En el otro extremo de la escala hay técnicas, como las imágenes por satélite y la fotografía aérea, que proporcionan indicaciones inmediatas de diferencias en la cubierta vegetal. Para entender el significado de estas diferencias uno tiene que bajar al suelo y hacer un estudio más o menos detallado, que suele consistir en expediciones y una buena cantidad de trabajo taxonómico. Estos esfuerzos se sitúan en medio del espectro, entre los estudios a largo plazo en el suelo y las inspecciones rápidas desde el aire o el espacio.

Ya nadie duda seriamente de que en los trópicos ha dado comienzo un episodio de extinción a gran escala. Para algunos, es evidente por sí mismo que no deberíamos destrozar caprichosamente el producto de miles de millones de años de evolución. Otros encuentran razones adicionales para proteger lo que corre peligro de perderse para siempre, entre ellas la utilidad potencial para los seres humanos de especies que estamos exterminando antes de saber siquiera que existen, por no hablar del valor que tiene para las generaciones futuras la percepción del funcionamiento de ecosistemas complejos en un estado relativamente no degradado. Una de las tareas importantes de los científicos es explicar estos argumentos en detalle. La ciencia puede proporcionar no sólo una guía para establecer prioridades, sino también una base lógica para las mismas.

En otras palabras, la preservación de la diversidad biológica requiere un mayor conocimiento científico, tanto para que los conservacionistas tengan una idea acertada de cómo proceder como para que puedan demostrar que lo que hacen tiene sentido. Una información precisa y bien organizada es una poderosa herramienta que puede contribuir a movilizar la conciencia social necesaria para proteger ejemplos viables de las diversas comunidades ecológicas. En este esfuerzo, pienso que son importantes las aportaciones y progresos de la disciplina de la biogeografía.

La biogeografía es el estudio de la distribución de plantas y animales y de la evolución de la misma, teniendo en cuenta la influencia de la geología y la topografía. Se ocupa de los procesos de variación, dispersión, supervivencia y extinción, así como de la historia y los procesos que determinan las fronteras de las distribuciones de los organismos actuales. La biogeografía, en estrecha relación con la sistemática y la ecología, puede proporcionar un cuerpo de teoría que contribuya a organizar los datos sobre presencia de especies animales y vegetales. Podría suministrar una clasificación de biomas y ser de gran utilidad en la planificación de un sistema viable de áreas protegidas y en la identificación de lagunas en los existentes.

Valoración rápida

Desde el punto de vista científico, es esencial mantener la investigación a largo plazo, que no proporciona resultados inmediatos pero sí duraderos. Pero, obviamente, la conservación no siempre puede esperar. Para cuando los biólogos de campo hayan completado un estudio meticuloso y exhaustivo de la flora y la fauna en un área tropical particular, puede que sea demasiado tarde para emprender la preservación de las comunidades de toda o parte del área porque tales comunidades habrán dejado de existir.

Ejercer la totalidad del espectro de actividades científicas necesarias para la conservación requiere el aprovechamiento creativo de todos los recursos potenciales. En particular, a partir de su adiestramiento, experiencia y conocimiento científico, unos pocos biólogos de campo (botánicos, ornitólogos y herpetólogos, por ejemplo) han aprendido cómo obtener rápidamente un censo aproximado de las especies presentes en un área tropical dada, se han formado una idea de la composición de diversos biomas y han desarrollado métodos ágiles para determinar el grado de degradación de un entorno determinado. Su conocimiento y juicio podría ser de utilidad en las tareas de preservación. Estimando la diversidad biológica de un área particular, así como el estado de conservación de sus comunidades naturales, y determinando qué biomas están restringidos a pequeñas regiones y cuáles están seriamente amenazados, pueden proporcionar una información inmensamente valiosa para los encargados de establecer las prioridades de protección. Estos mismos biólogos de campo pueden también contribuir en gran medida al éxito de las expediciones para observar sobre el terreno los datos de fotografías aéreas y satélites, así como al de los estudios sistemáticos y biogeográficos a largo plazo. Es de particular importancia formar más científicos como ellos, especialmente dentro de los propios países tropicales.

A través de la Fundación John D. y Catherine T. MacArthur, de la que soy director, colaboré en la puesta a punto del Programa de Valoración Rápida, bajo los auspicios de Conservación Internacional. Se reunió un núcleo compuesto por un ornitólogo, un teriólogo y dos botánicos. En asociación con otros biólogos de campo, se formaron equipos para explorar zonas particulares (principalmente americanas). Hasta ahora los equipos han examinado áreas muy diferentes que incluyen bosques secos, bosque húmedo de montaña y pluvisilvas, identificadas inicialmente por reconocimiento aéreo para descubrir si poseían suficiente diversidad biológica y estaban lo suficientemente poco degradadas para que su protección estuviese justificada.

En 1989 participé en uno de estos reconocimientos aéreos al lado de Spencer Beebe, entonces miembro de Conservación Internacional, y Ted Parker, el ornitólogo del programa. Encontramos un área selvática notablemente extensa y bien conservada en Bolivia, el Alto Madidi, que convertimos en uno de los primeros objetivos del programa. La zona abarca desde una selva de tipo amazónico (drenada por ríos tributarios del Amazonas, aunque a cientos de kilómetros de distancia del gran río) hasta bosques de montaña de varias clases. Más adelante, el equipo visitó la región y la estudió sobre el terreno, encontrándola todavía más rica en diversidad y calidad de lo que se adivinaba desde el aire. Ahora la Academia Boliviana de Ciencias y el gobierno boliviano se están planteando la posibilidad de extender la protección de sus selvas al Alto Madidi.

Caminando con Ted Parker por las selvas sudamericanas, no podía dejar de estar de acuerdo con los calificativos superlativos que había oído sobre él. De todos los ornitólogos de campo altamente experimentados a los que he acompañado, él fue el que me dejó más impresionado. Conocía de memoria y podía reconocer los cantos de más de tres mil aves del Nuevo Mundo. Al final del día había identificado cada sonido del bosque como obra de una rana, un insecto o un pájaro. Cuando hacíamos acudir a las aves reproduciendo en la selva sonidos grabados previamente, sus identificaciones siempre resultaban ser correctas. Pero de tarde en tarde, al oír un débil «Psst» entre la maleza, exclamaba: «¡No sé qué es esto!». Entonces seguro que se trataba de un ave hasta entonces no observada en el área o el país, o incluso, muy de vez en cuando, de una especie desconocida para la ciencia.

Escuchando al amanecer podía estimar, a partir de los cánticos y sonidos que oía, tanto la diversidad ornitológica como la calidad del hábitat. Sus colegas en teriología (Louise Emmons) y botánica (Alwyn Gentry y Robin Foster) llevaban a cabo hazañas semejantes en sus respectivas especialidades.

Recientemente, la tragedia golpeó a este extraordinario equipo.

Ted y Alwyn murieron, junto con un colega ecuatoriano, Eduardo Aspiazu, cuando su avión se estrelló durante un reconocimiento aéreo. El piloto también murió. Los biólogos, como es habitual, le habían pedido al piloto que volara más bajo para poder inspeccionar mejor el bosque desde el aire (estaban buscando una pequeña extensión de bosque seco cerca de Guayaquil). De pronto el avión entró en una nube, perdieron la visibilidad y colisionaron con una montaña cercana.

Mientras lloramos la pérdida de nuestros compañeros, que eran casi indispensables, los que estamos comprometidos en la conservación de los trópicos tenemos la esperanza de que el trabajo del Programa de Valoración Rápida continúe de alguna manera. Esperamos que su lugar sea ocupado por otros especialistas de campo igualmente diestros y que se formen otros nuevos, especialmente entre la población autóctona.

En general, el futuro de la preservación de la diversidad ecológica tropical depende en gran manera de las actividades del creciente cuerpo de científicos y conservacionistas de los propios países tropicales. Las decisiones principales en materia de conservación serán tomadas por lo general a escala nacional, y un creciente número de organizaciones ciudadanas están tomando el liderazgo de la protección de la diversidad biológica en los diversos países. Científicos de prestigio internacional de los países templados pueden ejercer cierta influencia, pero la conservación no podrá llevarse a cabo sin el apoyo local y nacional.

Participación de la población local

De hecho, la conservación necesita tanto del apoyo de individuos influyentes, para que los proyectos se pongan en marcha, como del de las poblaciones rurales locales para el mantenimiento de las reservas naturales. La protección de grandes áreas a largo plazo no puede prosperar a menos que sea vista con buenos ojos por la población local. Esto significa hacer hincapié en las posibles contribuciones de la conservación al desarrollo rural. Por ejemplo, la agricultura depende a menudo de la protección de las cuencas fluviales, y la disponibilidad a largo plazo de productos forestales para el consumo y la venta requiere a menudo el mantenimiento de tierras de bosque cercanas. La población local tiene que obtener algún beneficio de la conservación, y tiene que ser consciente de este beneficio. A menudo los indígenas pueden estar directamente ligados a las áreas protegidas, a través del turismo natural o sirviendo como guías o guardas en los p arques nacionales.

Es de particular importancia implicar a los pueblos indígenas locales. En muchos casos, su continuidad cultural y hasta física están más amenazadas incluso que las plantas y animales de las áreas donde viven. Su conocimiento del medio en el que viven, acumulado a lo largo de muchos siglos, puede servir para encontrar usos humanos de los organismos nativos, así como maneras de ganarse la vida sin destruir las comunidades ecológicas locales. En algunos casos los pueblos indígenas han tomado la iniciativa en los esfuerzos de conservación, como por ejemplo los kuna de Panamá, que han convertido en parque una fracción importante de su territorio en el continente (muchos de los kuna viven en las islas de San Blas, donde son bien conocidos como artífices de las pintorescas molas, usadas a menudo para decorar vestidos y bolsos).

La lucha de los organismos por la vida en los bosques tropicales conduce a una escalada de armas químicas y otros procesos que generan sustancias con potentes efectos biológicos, muchas de las cuales son de utilidad, especialmente en medicina. Estos productos químicos se buscan de dos maneras diferentes. Un método, la etnobotánica, explota el conocimiento de los pueblos indígenas, obtenido mediante prueba y error a lo largo de cientos o miles de años, haciendo así uso de la evolución cultural tanto como de la evolución biológica que produjo las sustancias. El otro método es la prospección química directa, llevando especímenes de plantas y animales (insectos, por ejemplo) al laboratorio y aislando productos químicos nuevos mediante métodos modernos de extracción. Aquí los resultados de la evolución biológica se explotan sin la intervención de las culturas indígenas. Ambos métodos aspiran a encontrar al menos unas pocas sustancias que puedan utilizarse, por ejemplo, para elaborar fármacos, casi siempre en los países desarrollados. Aunque tales sustancias se emplearían en forma tratada o sintética, hay que encontrar el modo de que una fracción significativa de los beneficios vuelva a los pueblos del bosque o de las áreas adyacentes. Sólo así el proceso de explotación y consumo puede representar un beneficio adicional para los pueblos locales fruto de la preservación de la vegetación. Lo mismo puede aplicarse a muchos esquemas para la gestión de productos forestales distintos de la madera, como frutos tropicales secos y suculentos. Como siempre, los incentivos crean presiones selectivas sobre los esquemas de comportamiento humano.

Un espectro de prácticas conservacionistas

El aprovechamiento de ciertos productos forestales distintos de la madera (como los derivados de la caza) sólo puede llevarse a cabo, igual que el de la madera misma, en áreas que como mucho estén sólo parcialmente protegidas. Un modelo que ha sido ampliamente adoptado y cuenta con la aprobación de Naciones Unidas es la creación de reservas de la biosfera. Una reserva de la biosfera típica consta de un área central, a menudo una cuenca fluvial agreste, absolutamente protegida y una región circundante en la que se permiten ciertas prácticas de explotación controladas. Más allá de esta zona, pero todavía dentro de la reserva, puede haber áreas donde se permita la agricultura y otras actividades económicas normales, pero con algunas restricciones.

Está claro que el establecimiento de un sistema de áreas naturales totalmente protegidas, incluidas las del interior de las reservas de la biosfera, es sólo una parte de lo que hay que hacer. Fuera de esas áreas se requiere una amplia variedad de prácticas conservacionistas, entre ellas la repoblación forestal (con especies nativas siempre que sea posible), la implantación de políticas racionales energéticas y de aguas, la minimización de los efectos sobre el medio ambiente de actividades como la agricultura, la minería y la industria, y la atención al problema, de máxima importancia, del crecimiento demográfico. Por otra parte, es muy deseable el desarrollo de estrategias de conservación integradas tanto nacionales como regionales.

Muchos aspectos de la conservación en este sentido amplio requieren una financiación que los países tropicales más pobres no pueden permitirse. Para las naciones desarrolladas de la zona templada, asumir una buena parte de la carga es algo que a la larga redundará en su propio beneficio. Todos los que nos encontramos sobre la superficie de este planeta saldremos perdiendo si la riqueza biológica de los trópicos continúa devastándose. Dondequiera que lleguen recursos procedentes de los países desarrollados, sea a través de donativos, préstamos o remoción parcial de la deuda, una fracción apreciable debería reservarse para la conservación en sentido amplio. Un acuerdo para la práctica de la conservación a cambio de ayudas es parte de lo que a veces se ha dado en llamar «el contrato planetario». En los últimos años se han llevado a cabo unos cuantos «canjes de deuda». Las deudas de algunos países tropicales han sido asumidas por organizaciones conservacionistas a cambio de que los gobiernos dediquen una parte proporcional de las tierras a áreas protegidas (el mismo principio puede aplicarse a otros objetivos deseables, como el desarrollo económico de un país subdesarrollado o la educación superior en el extranjero para sus ciudadanos). Los canjes de deuda son ejemplos excelentes de contrato planetario.

Si uno se parara a pensar en las perspectivas de éxito de un programa global de conservación de la diversidad biológica en los trópicos, quizá los resultados serían poco esperanzadores. Sin embargo, la historia muestra claramente que la humanidad avanza no gracias a aquellos que se detienen a cada paso para calibrar el éxito o fracaso final de sus aventuras, sino a quienes piensan profundamente en lo que es justo y luego ponen toda su energía en alcanzarlo.

La preservación de la diversidad cultural

Del mismo modo que es una locura tirar por la borda en unas pocas décadas la riqueza biológica que ha evolucionado a lo largo de miles de millones de años, también lo es permitir la desaparición de la diversidad cultural humana, que ha evolucionado de manera análoga a lo largo de muchas decenas de miles de años. Pero la unidad de la especie humana (así como la solidaridad con las otras formas de vida con las que compartimos la biosfera) es ahora más necesaria que nunca. ¿Cómo pueden reconciliarse ambas inquietudes?

Tomé conciencia por primera vez de la tensión entre unidad y diversidad a una edad temprana. Cuando era niño, le planteé a mi padre la vieja cuestión de si la humanidad podría promover la paz universal haciendo uso de un único lenguaje mundial. En respuesta él me contó que doscientos años atrás, en la era de la Ilustración y la Revolución Francesa, el pensador alemán Herder, un pionero del romanticismo y figura de la Ilustración, escribió acerca de la necesidad de preservar la diversidad lingüística salvando las lenguas letona y lituana —tan arcaicas, tan cercanas a la lengua indoeuropea ancestral— en peligro de desaparecer. Con la ayuda de escritores nativos de la época, como el poeta lituano Donelaitis, la tarea de conservar estos pedazos de ADN cultural pudo completarse. Hoy Letonia y Lituania son otra vez países independientes, y los lenguajes salvados de la extinción hace dos siglos son ahora lenguas oficiales.

Los problemas relativos a la conservación cultural que representan un desafío mayor tienen que ver con los pueblos indígenas, especialmente los que son a veces calificados de primitivos, fundamentalmente por el estado de su tecnología. En muchos casos, estos mismos pueblos indígenas están siendo físicamente exterminados por las enfermedades y la violencia, o bien desplazados o dispersados y aniquilados culturalmente. Hace un siglo, en algunas partes del oeste de los Estados Unidos, todavía había gente que se dedicaba a disparar a los «indios salvajes» los fines de semana. Así fue como Ishi, el último indio yahi, perdió a su familia y amigos, según el relato de Alfred y Theodora Kroeber. Hoy día los norteamericanos deploran atrocidades similares cometidas en otros países. Esperemos que la desesperada situación presente pueda mejorar con rapidez y estos pueblos tengan mayores oportunidades de sobrevivir y de elegir entre seguir más o menos aislados en el futuro o modernizarse conservando una continuidad cultural y una memoria del pasado.

Las ricas tradiciones locales, así como las instituciones y modos de vida, de los pueblos indígenas de todo el mundo constituyen un tesoro de información sobre las posibilidades de organización y modos de pensar humanos. Muchos de ellos poseen también conocimientos preciosos sobre cómo vivir formando parte de una comunidad ecológica tropical. (Hay que hacer notar que otros han destruido la naturaleza, particularmente los pueblos que han colonizado islas deshabitadas, grandes o pequeñas, por menos de uno o dos milenios. En algunos casos, la idea de un pueblo indígena viviendo en armonía con la naturaleza es más una ilusión que una realidad.)

Pensemos en el conocimiento de las propiedades de las plantas que se alberga en la mente de ciertos chamanes. Muchos de estos hechiceros están ahora falleciendo sin que nadie les reemplace. Richard Schultes, el gran etnobotánico de Harvard que pasó muchos años estudiando plantas medicinales en la cuenca amazónica, dice que cada vez que muere un chamán es como si ardiera una biblioteca. Schultes ha adiestrado a muchos etnobotánicos más jóvenes, que han emprendido la labor de salvaguardar tantos secretos como sea posible de estas bibliotecas vivientes antes de que desaparezcan definitivamente. Uno de ellos, Mark Plotkin, publicó recientemente un delicioso relato de sus aventuras titulado Tales of a Shaman ’s Apprentice (Cuentos de un aprendiz de chamán).

Los seres humanos han destilado, durante cientos o miles de años de aprendizaje por el método de prueba y error, una considerable cantidad de información sobre los usos de los organismos para la obtención de alimento, medicinas y vestido. A veces el proceso de aprendizaje debe haber sido verdaderamente dramático, como en el caso de la mandioca, una planta de la selva amazónica. No hay muchas plantas que crezcan en el suelo de la selva, pues la mayor parte de la luz es captada por los árboles del dosel superior, medio e inferior. En estas condiciones, la mandioca (el tubérculo del que se hace la tapioca) es un valioso recurso, comestible y nutritivo. Pero el tubérculo contiene una buena cantidad de ácido prúsico (cianuro de hidrógeno) y es por lo tanto muy venenoso. Sólo calentando para descomponer y expulsar el ácido se hace comestible la carne del tubérculo. Muchos miembros hambrientos de bandas y tribus amazónicas deben haber perdido la vida antes de que se aprendiera a utilizar la mandioca.

No es sólo en estas regiones subdesarrolladas donde el método de ensayo y error ha revelado propiedades útiles de plantas y preparados vegetales. La medicina popular ha tenido gran importancia para la vida de las personas en todo el planeta. Naturalmente, no todas las recetas populares están justificadas, pero la ciencia moderna ha confirmado algunas de ellas. Como ejemplo citaré una experiencia de mi propio padre. Hijo de un guardabosques, cuando era todavía un muchacho y vivía en los bosques de hayas de lo que entonces era Austria oriental, cerca de la frontera rusa, se cortó accidentalmente con un hacha la última falange de un dedo. Entonces la cogió, la enjuagó un poco y se la volvió a colocar, envolviendo el dedo con una cataplasma hecha de miga de pan. Llevó la cicatriz circular durante el resto de su vida, pero la falange se mantuvo en su sitio. Esto sucedió muchos años antes de que la ciencia moderna reconociera las propiedades bacteriostáticas del moho del pan (Penicillium notatum), pues sin duda fueron estas propiedades las que salvaron el dedo de mi padre.

En el proceso adaptativo por el que los grupos humanos hacen estos descubrimientos útiles, las presiones selectivas tienen que haber traído consigo algunas cuestiones muy similares a las que se plantea la ciencia. ¿Sirve para algo este procedimiento? ¿Se puede comer esto tranquilamente? ¿Sanan las heridas envolviéndolas así? ¿Ayuda esta hierba a acelerar el parto cuando el niño se retrasa?

Los remedios populares que derivan de la magia simpática son otra cosa. Entre las pretendidas curas basadas en la similaridad hay una para la ictericia (en realidad un síntoma de enfermedad hepática) que consiste en mirar fijamente el ojo dorado de un alcaraván. Si mi padre hubiera probado esto, de poco le habría servido, fuera de algún ligero efecto psicosomático. En la evolución de la magia simpática, tan extendida entre los pueblos de la Tierra, las presiones selectivas, como ya hemos remarcado antes, eran en su mayoría muy diferentes de las que corresponderían a un éxito objetivo.

Pero aquellos pueblos no necesariamente trazaban una frontera clara entre la magia y el descubrimiento de usos reales de productos animales y vegetales. Los hechiceros no dejaban de ser hechiceros, aunque enseñaran al mundo moderno el empleo de materiales como la corteza de chinchona, de la que se extrae la quinina, un tratamiento contra la malaria. En las tradiciones culturales no siempre es fácil separar lo que se adapta fácilmente a las ideas modernas de lo que entra en conflicto con ellas.

La tensión entre ilustración y diversidad cultural

La tensión entre la universalidad soñada por la Ilustración y la necesidad de preservar la diversidad cultural continúa existiendo en nuestros días. En la discusión sobre el futuro del planeta, incluyendo los resultados de la investigación científica y tratando de reflexionar racionalmente sobre sus implicaciones, nos vemos obstaculizados por el predominio de la superstición. La persistencia de creencias erróneas contribuye a exacerbar la extendida y anacrónica incapacidad para reconocer los problemas urgentes a los que se enfrenta la humanidad en este planeta. Naturalmente, la ausencia de unidad filosófica y, especialmente, los particularismos destructivos de toda clase constituyen una seria amenaza. T ales particularismos se siguen manifestando en muchos sitios en forma de tribalidad, pero hoy día pueden relacionarse con diferencias de nacionalidad, lengua, religión o de otro tipo, a veces tan pequeñas que alguien ajeno a la cuestión difícilmente puede detectarlas, pero suficientes para dar lugar a rivalidades y odios mortíferos, especialmente cuando son explotados por dirigentes poco escrupulosos.

Pero, al mismo tiempo, la diversidad cultural es en sí misma una valiosa herencia que debería preservarse: esa torre de Babel de lenguas, esa confusión de sistemas religiosos y éticos, ese panorama mítico, esa mezcolanza de tradiciones políticas y sociales, acompañadas como están por tantas formas de irracionalidad y particularismo. Uno de los principales retos de la raza humana es reconciliar los factores universalizantes como la ciencia, la tecnología, la racionalidad y la libertad de pensamiento con los factores particularizantes como las tradiciones y creencias locales, así como las simples diferencias geográficas, de temperamento o de ocupación.

Cultura popular universal

La erosión de los modelos culturales locales en todas partes del mundo no es, sin embargo, resultado únicamente, ni siquiera principalmente, del contacto con los efectos universalizantes de la ilustración científica. La cultura popular es casi siempre mucho más efectiva a la hora de borrar distinciones entre lugares o sociedades. Los tejanos, las hamburguesas, la música rock y las series de televisión norteamericanas han estado propagándose por el mundo durante años. Por otra parte, las influencias universalizantes no pueden clasificarse simplemente como pertenecientes a la cultura científica o a la popular, sino que forman un continuo, un espectro de impactos culturales diferentes.

Ocupando una posición intermedia entre la cultura superior y la popular hay instituciones como la CNN (Cable News Network). En algunos lugares y en determinadas ocasiones, las emisiones de la CNN son una valiosa y oportuna fuente de imágenes memorables y de información razonablemente precisa que de otra manera sería inasequible. En otras situaciones parece representar una forma de diversión, parte de la cultura popular universalizante. En cualquier caso, los telediarios emitidos en todo el mundo y los diarios y revistas semanales que se publican en muchos países se consideran parte de la «explosión informativa» mundial, junto con la increíble proliferación de publicaciones periódicas y libros de carácter no literario, por no hablar del veloz crecimiento de las redes de correo electrónico y la explosión venidera de comunicaciones multimedia interactivas.

La explosión informativa (¿o desinformativa?)

Desafortunadamente, esta explosión informativa es en gran parte desinformativa. Todos estamos expuestos a enormes cantidades de material consistente en datos, ideas y conclusiones —en gran parte mal comprendidos o simplemente equivocados—. La necesidad de comentarios y reseñas más inteligentes es acuciante.

Debemos conceder más prestigio al acto creativo en sí, a la redacción de artículos y libros serios que distingan lo fidedigno de lo que no lo es y sistematicen y encapsulen, en la forma de teorías razonables y otras clases de esquema, lo que parece digno de crédito. Si un investigador o investigadora publica un resultado novedoso en las fronteras del conocimiento científico o el saber en general, puede obtener una recompensa en forma de cátedra o ascenso, aunque se demuestre después que el resultado era totalmente incorrecto. Ahora bien, dedicándose a poner en claro lo que otros han hecho (o a extraer lo que vale la pena de entre lo accesorio) es mucho menos fácil hacer carrera. Sería mucho mejor para la humanidad que la estructura de recompensas se modificase de manera que las presiones selectivas sobre las carreras favoreciesen el examen de la información tanto como su adquisición.

Tolerar la intolerancia: ¿Es eso posible?

¿Pero cómo podemos reconciliar el examen crítico de las ideas, incluso la identificación y clasificación del error, con la tolerancia —e incluso la celebración y preservación— de la diversidad cultural? Hemos discutido cómo cada tradición cultural específica incluye, en forma de motivos artísticos, ideas y creencias que definen y unifican las fuerzas sociales y son fuente de consuelo personal frente a la tragedia. Como hemos destacado, muchas de estas ideas y creencias serían etiquetadas como erróneas por la ciencia (o al menos no justificadas por la evidencia) mientras que otras representan preciosos descubrimientos sobre el mundo natural y sobre posibles formas de desarrollo humano individual y social (incluidas, quizá, la exploración de nuevos dominios de la experiencia mística y la formulación de escalas de valores que subordinen el apetito por los bienes materiales a otros más espirituales). La preservación de la diversidad cultural, sin embargo, tiene que superar de algún modo esa distinción. Los modelos o esquemas que son elementos de ADN cultural no son fácilmente clasificables entre los que vale la pena preservar y los que no.

Pero hay una dificultad aún más profunda. Muchos de los modelos locales de pensamiento y comportamiento están asociados no sólo con errores dañinos y particularismos destructivos, sino de modo específico con el hostigamiento y la persecución hacia aquellos que se adhieren a la cultura científica laica y universalizante, con su acento en la racionalidad y en los derechos humanos individuales. Y es precisamente en el seno de estas culturas donde es más fácil encontrar gente comprometida, por cuestión de principios, con la preservación de la diversidad cultural.

De algún modo, la especie humana tiene que encontrar maneras de respetar y beneficiarse de la gran variedad de tradiciones culturales y a la vez resistir las amenazas de desunión, opresión y oscurantismo que de vez en cuando representan algunas de estas mismas tradiciones.

Capítulo 22
Transiciones hacia un mundo más sostenible

La preocupación por la preservación de la diversidad biológica es inseparable de la preocupación por el futuro del conjunto de la biosfera, pero el destino de la biosfera está a su vez estrechamente ligado con virtualmente todos los aspectos del futuro humano. Trataré de detallar aquí una especie de proyecto investigador acerca del futuro de la especie humana y del resto de la biosfera. Este proyecto no pretende quedarse en predicciones poco definidas. Es más bien un llamamiento para que personas que trabajan en un gran número de instituciones y una amplia variedad de disciplinas se unan para concebir posibles escenarios evolutivos que, partiendo de la situación presente, conduzcan hacia un mundo más sostenible en el siglo XXI. Este enfoque es más concreto que la simple especulación sobre lo que podría acontecer en el futuro.

¿Por qué es necesario pensar a tan gran escala? ¿No sería mejor un proyecto más manejable que se concentrase en un aspecto particular de la situación mundial?

El hecho es que vivimos en una época de especialización creciente, y por buenas razones. La humanidad puede así acumular más conocimientos dentro de cada campo de estudio, y a medida que una especialidad crece, tiende a dividirse en subespecialidades. Este proceso se repite una y otra vez, cosa que es tanto necesaria como deseable. Sin embargo, se hace también cada vez más necesario complementar la especialización con la integración. La razón es que no existe sistema complejo no lineal que pueda describirse adecuadamente dividiéndolo en subsistemas o en diversos aspectos definidos de antemano. Si estas partes, todas en mutua interacción, se estudian por separado, aunque sea con un alto grado de detalle, los resultados, una vez reunidos, no proporcionan una buena imagen del conjunto. En ese sentido, hay una profunda verdad en el viejo adagio que dice: «El todo es más que la suma de sus partes».

Es necesario, por lo tanto, abandonar la idea de que lo único serio es trabajar con todas las energías en un problema bien definido en el marco de una disciplina restringida y dejar las ideas de carácter eminentemente integrador para las fiestas de sociedad. En la vida académica, en las burocracias y en todas partes, la labor integradora es infravalorada. Y, sin embargo, cualquier alto cargo de una organización, sea un presidente, un primer ministro o un secretario general, tiene que tomar decisiones como si todos los aspectos de la cuestión, junto con sus influencias mutuas, se tuviesen en cuenta. ¿Es razonable que cuando el dirigente busca asesoramiento encuentre únicamente especialistas y tenga que hacerse cargo él solo de la reflexión integradora a la hora de hacer los juicios intuitivos finales?

En el Instituto de Santa Fe, donde científicos, sabios y pensadores de todo el mundo, representantes de virtualmente todas las disciplinas, se reúnen para investigar acerca de los sistemas complejos y de cómo surge la complejidad a partir de leyes simples subyacentes, se encuentra gente que tiene el coraje de dar un vistazo a la totalidad además de estudiar las partes de un sistema a la manera tradicional. Quizás el Instituto pueda contribuir a que se produzca una explosión de investigación conjunta sobre vías potenciales hacia un mundo más sostenible por parte de instituciones de todo el globo dedicadas a estudiar aspectos particulares de la situación mundial. Los aspectos en cuestión tendrían que incluir asuntos políticos, militares, diplomáticos, económicos, sociales, ideológicos, demográficos y medioambientales. Con el nombre de Proyecto 2050 ha dado comienzo un esfuerzo relativamente modesto bajo la dirección del Instituto de Recursos Mundiales, la Institución Brookings y el propio Instituto de Santa Fe, en el que participan personas e instituciones de muchas partes del mundo.

Ahora bien, ¿qué es lo que se entiende aquí por sostenible? En A través del espejo, Humpty Dumpty explica a Alicia cómo emplea las palabras para significar lo que le venga en gana, pagándoles por ese privilegio cada sábado por la noche (el final de la semana laboral decimonónica). Estos días debe haber mucha gente pagando primas a la palabra «sostenible». Por ejemplo, si el Banco Mundial tiene que financiar algún anticuado proyecto de desarrollo masivo destructivo para el medio ambiente, muy bien puede ponérsele la etiqueta de «desarrollo sostenible» con la intención de hacerlo más aceptable.

Esta práctica me recuerda el gag de los Monty Python en el que un hombre entra en una oficina para pedir una licencia para su pez, Eric. Cuando el funcionario le dice que no existen las licencias para peces, él replica que le dijeron lo mismo cuando pidió una licencia para gatos, pero que él tenía una. Tras enseñársela al funcionario, éste le dice: «Esto no es una licencia para gatos. Es una licencia para perros con la palabra “perro” tachada y la palabra “gato” escrita encima a lápiz».

Hoy día hay mucha gente atareada en escribir a lápiz la palabra «sostenible». La definición no siempre está clara, por lo que no es irrazonable asignar aquí un significado a la palabra. Evidentemente, la definición literal es inadecuada. La ausencia completa de vida en la Tierra sería sostenible durante cientos de millones de años, pero está claro que no es esto lo que perseguimos. La tiranía universal podría sostenerse durante muchas generaciones, pero tampoco es esto lo que buscamos. Imaginemos un mundo atestado de gente, quizás extremadamente violento y autoritario, con sólo unas pocas especies de plantas y animales supervivientes (las que están en íntima conexión con la sociedad humana). Aunque tales condiciones podrían mantenerse, no se corresponderían con lo que queremos significar aquí. Está claro que vamos en busca de unas condiciones que, aparte de sostenibles, sean mínimamente deseables. Curiosamente, hay en la actualidad un cierto grado de acuerdo teórico sobre lo que es deseable, sobre las aspiraciones de la especie humana tal y como están expresadas, por ejemplo, en las declaraciones de Naciones Unidas.

Entonces, ¿qué tipo de futuro estamos concibiendo para nuestro planeta y nuestra especie cuando hablamos de sostenibilidad, atemperando nuestros deseos con cierta dosis de realismo? Seguramente no uno de estancamiento, sin esperanza para las personas hambrientas u oprimidas. Pero tampoco uno de abuso continuado y creciente del medio ambiente a medida que la población crece, los pobres intentan elevar su nivel de vida y los ricos provocan un enorme impacto ambiental per capita. Por otro lado, la sostenibilidad no se refiere sólo a cuestiones medioambientales y económicas.

En términos negativos, la especie humana tiene que evitar la guerra aniquiladora, la tiranía generalizada y la omnipresencia continuada de la pobreza extrema, así como la desastrosa degradación de la biosfera y la destrucción de la diversidad biológica y ecológica. La idea fundamental es el logro de mayor calidad de vida sin que se adquiera principalmente a expensas del futuro. Esto abarca la supervivencia de cierto grado de diversidad cultural y también de muchos de los organismos con los que compartimos el planeta, así como las comunidades ecológicas de que forman parte.

Desde el punto de vista tecnológico, hay optimistas que piensan que los humanos no necesitamos cambiar demasiado el curso de las cosas para evitar un futuro desastroso, que podemos lograr una sostenibilidad aceptable sin esfuerzos especiales, a través de una serie ilimitada de ajustes tecnológicos simples. Algunos ni siquiera creen en la sostenibilidad como objetivo. Pero eso no impide que todos podamos reflexionar sobre ella. Incluso quienes no aceptan que la sostenibilidad sea un objetivo irrenunciable pueden preguntarse si hay maneras de acercarse a ella en los próximos cincuenta a cien años y, si las hay, qué alternativas habría y qué mundo resultaría. El debate sobre una cuestión no requiere que se compartan los puntos de vista de quienes lo plantean.

Los historiadores tienden a irritarse cuando alguien sentencia: «Éste es un período único en la historia». Pero nuestra época es efectivamente especial en dos aspectos bien definidos y estrechamente relacionados.

En primer lugar, la especie humana ha alcanzado la capacidad técnica de alterar la biosfera a través de efectos de primer orden. La guerra es antigua, pero la escala a la que puede desencadenarse hoy día es enteramente nueva. Es sabido que una guerra termonuclear total arrasaría una fracción significativa de la vida planetaria, sin mencionar los problemas que podría causar el armamento biológico o químico. Por otro lado, a través del crecimiento demográfico y determinadas actividades económicas, los humanos están alterando el clima global y exterminando un número significativo de especies animales y vegetales. A decir verdad, los seres humanos han causado en el pasado más destrucción de lo que suele admitirse. La deforestación por obra de hachas y cabras, con la consiguiente erosión y desecación, data de hace miles de años y ya fue señalada, por ejemplo, por Plinio el Viejo. Hasta los pequeños grupos humanos que vivían en Norteamérica hace diez mil años podrían haber contribuido a la extinción de la megafauna norteamericana de la era glacial, de la que formaban parte mamuts, perezosos gigantes, lobos de las cavernas, felinos de dientes de sable y diversas especies de camélidos y equinos (una teoría atribuye algunas de las extinciones, al menos parcialmente, al hábito de hacer despeñarse rebaños enteros de animales por los acantilados para después aprovechar sólo la carne y la piel de unos cuantos). Sin embargo, el perjuicio potencial para la biosfera en su totalidad es ahora mucho mayor que nunca antes. La actividad humana ha provocado ya múltiples problemas medioambientales, incluyendo cambios climáticos, contaminación oceánica, empobrecimiento de la calidad del agua dulce, deforestación, erosión del suelo, etc. Y como los conflictos, muchos de los males que afectan al medio ambiente son antiguos, pero su escala actual no tiene precedentes.

En segundo lugar, el crecimiento de la población mundial y la merma de los recursos naturales no pueden continuar para siempre; pronto se alcanzará un punto de inflexión (cuando la tasa de crecimiento comience a disminuir). El siglo XXI es un periodo crucial (en el sentido original de encrucijada) para la especie humana y el planeta. Durante muchos siglos, la población humana total en función del tiempo se ha ajustado estrechamente a una curva hiperbólica simple que se eleva hasta infinito hacia el año 2025. La nuestra es, obviamente, la generación en la que la población mundial tiene que empezar a despegarse de esa hipérbola, y de hecho ya ha comenzado a hacerlo. Ahora bien, ¿se aplanará la curva de población gracias a la previsión humana y el progreso hacia un mundo sostenible o bien caerá y fluctuará de resultas de los tradicionales azotes de la guerra, el hambre y las epidemias? Si las curvas de población y agotamiento de recursos se aplanan, ¿lo harán de manera que sea posible una razonable calidad de vida —incluyendo cierto grado de libertad— y la persistencia de una alta diversidad biológica, o bien tendremos un mundo gris de escasez, polución y autoritarismo, con plantas y animales reducidos a unas pocas especies que coexistan con facilidad con la nuestra?

Una cuestión similar puede plantearse en relación al desarrollo progresivo de los medios militares y la escala de los conflictos. ¿Permitirá la gente que estallen guerras aniquiladoras a gran escala o hará uso de su inteligencia y capacidad de previsión para limitar y reorientar las luchas, suavizar los conflictos y equilibrar la rivalidad con la cooperación? ¿Aprenderemos, o quizá ya hemos aprendido, a tratar nuestras diferencias sin la posibilidad de guerras catastróficas? ¿Y los conflictos menores que surgen de la desintegración política?

Gus Speth, que fue el primer presidente del Instituto de Recursos Mundiales (en cuya fundación tengo el honor de haber colaborado), ha sugerido que el desafío para el género humano en las próximas décadas consistirá en efectuar una serie de transiciones interrelacionadas. Yo propongo ampliar ligeramente sus concepciones incorporando consideraciones de orden más político, militar y diplomático, sumadas a las de orden social, económico y medioambiental que él destaca. Con estas modificaciones, el resto de este capítulo se organiza alrededor de esta noción, algo tosca pero útil, de conjunto de transiciones.

La transición demográfica

Hemos visto que las décadas venideras serán testigo de un cambio histórico en la curva demográfica global. La mayoría de expertos piensa que la población mundial se estabilizará en el próximo siglo en torno al doble de la población actual, estimada en unos 5500 millones de personas. Hoy día, las altas tasas de crecimiento demográfico (que tienen que ver fundamentalmente con unas mejoras en la medicina y la salud pública que no han llevado aparejado un descenso de la natalidad) todavía predominan en muchas partes del mundo. Esto ocurre especialmente en las regiones tropicales subdesarrolladas, incluyendo países que, como Kenia, no pueden permitírselo ni ecológica ni económicamente. Mientras tanto, la población de los países desarrollados en general se ha estabilizado bastante, si se exceptúan los efectos de la migración, la cual ciertamente será un asunto de la mayor importancia en las décadas venideras.

Los expertos se han enzarzado en muchas discusiones sobre los factores responsables del declive de la natalidad que ha tenido lugar en la mayoría de países desarrollados, y ahora sugieren medidas encaminadas a producir los mismos efectos en el mundo tropical. Estas medidas incluyen mejoras en la sanidad, alfabetización, educación y oportunidades de las mujeres además de otros progresos en la condición femenina, una reducción en la mortalidad infantil (lo cual en principio obra, naturalmente, en sentido opuesto, pero más adelante puede evitar que las parejas intenten compensar las muertes esperadas produciendo más niños de los que realmente desean) y un seguro social para los mayores, una meta aún distante en muchos países en vías de desarrollo.

Naturalmente, la disponibilidad de una contracepción segura y efectiva es crucial, pero también lo es la erosión de los incentivos tradicionales para tener familias numerosas. En diversas partes del mundo la pareja típica (y especialmente el varón típico) todavía desea tener muchos hijos. ¿Qué clase de incentivos pueden ofrecerse a las familias de uno o dos hijos? ¿Cómo puede persuadirse a la gente,

por las vías culturalmente apropiadas, de que en el mundo moderno tales familias son de interés común, con mayores niveles de sanidad, educación, prosperidad y calidad de vida de lo que permiten las familias numerosas? Con la importancia que tienen en los asuntos humanos los vaivenes de la moda, ¿qué se puede hacer para popularizar la idea de una familia pequeña? Estas cuestiones todavía están desatendidas en muchos sitios, incluso por parte de las organizaciones que declaran estar contribuyendo a resolver el problema de la población mundial.

Si es cierto que la población humana se encamina hacia un punto de inflexión y que acabará estabilizándose globalmente en unas pocas décadas, es de la mayor importancia tanto el proceso histórico en sí como su duración y las cifras resultantes. El carácter exacto y la magnitud del efecto del crecimiento demográfico sobre la calidad del medio ambiente depende de muchas variables, como por ejemplo el reparto de las tierras, y valdría la pena hacer un cuidadoso estudio en áreas diferentes. No obstante, de entrada parece evidente que, en conjunto, el crecimiento demográfico contribuye a la degradación del medio ambiente, ya sea por las enormes tasas de consumo de los ricos o por la desesperada lucha de los pobres por sobrevivir, sea cual sea el precio de cara al futuro.

Las consecuencias para el medio ambiente serán probablemente mucho más serias si el mundo simplemente espera a que mejoren las condiciones económicas entre las poblaciones empobrecidas para que surtan efecto las medidas de reducción de la natalidad, en vez de fomentar tal reducción en paralelo con el desarrollo económico. Es muy probable que el impacto medioambiental total por persona sea considerablemente mayor tras el desarrollo económico que antes, y cuanto menores sean las cifras cuando finalmente se alcance una prosperidad relativa, mejor para las personas y para el resto de la biosfera.

La transición tecnológica

Hace unas décadas, algunos de nosotros (en particular Paul Ehrlich y John Holdren) señalábamos el hecho absolutamente obvio de que el impacto sobre el medio ambiente en un área geográfica determinada puede descomponerse en tres factores: población, prosperidad convencional por persona e impacto medioambiental por persona y por unidad de prosperidad convencional. El último factor depende especialmente de la tecnología. Es el cambio tecnológico el que de algún modo ha permitido la existencia de la gigantesca población humana actual, y mientras miles de millones de personas viven en una situación de pobreza desesperada, unos pocos consiguen vivir con unas comodidades razonables como consecuencia de los adelantos científicos y tecnológicos, incluida la medicina. Los costes medioambientales han sido enormes, pero en ninguna parte tan grandes como pueden serlo en el futuro si el género humano no actúa con algo de previsión.

La tecnología, bien aprovechada, puede contribuir a reducir el tercer factor prácticamente tanto como lo permitan las leyes naturales. Cuánto puede mejorarse el factor de prosperidad, especialmente en lo que se refiere a la pobreza extrema, depende en considerable medida de cuánto acapara el primer factor, el número de personas.

La evidencia del comienzo de la transición tecnológica está empezando a manifestarse en muchos sitios, aunque el grueso de la misma está aún por llegar. Pero hasta elementos tecnológicos relativamente simples pueden acabar planteando problemas extremadamente complejos.

Considérese el ejemplo de la erradicación de la malaria en las poblaciones humanas. Hace no demasiado tiempo, la desecación de los pantanos era todavía el principal método de control. Pero ahora se entiende que hay que evitar la destrucción de los pantanales siempre que sea posible. Entretanto la ciencia había identificado el plasmodio responsable de la malaria y sus mosquitos vectores. La fumigación con plaguicidas químicos como el DDT para eliminar los mosquitos parecía un paso adelante, pero resultó tener serias consecuencias para el medio ambiente. En primer lugar, las aves en lo más alto de la cadena trófica acuática comenzaron a acumular altas dosis de DDE, un metabolito del DDT que causaba un adelgazamiento de las cáscaras de los huevos provocando el fracaso reproductivo de muchas especies, incluida el águila calva, emblema nacional norteamericano. Hace veinte años que el DDT quedó desfasado en el mundo desarrollado, y las poblaciones de aves amenazadas comenzaron a recuperarse. Pero todavía se sigue utilizando en otras partes, aunque están comenzando a aparecer cepas resistentes del mosquito vector.

Después resultó que algunos de los sustitutos inmediatos del DDT eran claramente peligrosos para los humanos. Hoy día, sin embargo, hay métodos mucho más sofisticados para reducir la población de vectores, incluyendo el uso de productos químicos específicos, así como la liberación de compañeros sexuales estériles y otros «controles biológicos». Todas estas medidas pueden coordinarse en lo que se denomina «gestión integrada de plagas». Hasta ahora el empleo a gran escala de tales métodos todavía resulta demasiado caro. En el futuro podrían desarrollarse técnicas más baratas e igualmente inocuas. También se dispone de repelentes de insectos, pero son igualmente caros y plantean problemas propios.

Mientras tanto, un tratamiento simple y efectivo en muchos sitios es meterse dentro de un mosquitero media hora al amanecer y media hora al anochecer, cuando actúa con preferencia el mosquito vector. Por desgracia, en muchos países tropicales la población rural está demasiado atareada a esas horas para meterse debajo de una red.

Es probable que algún día se desarrollen vacunas contra la malaria que erradiquen completamente las diversas formas de la enfermedad, pero entonces surgirá otra dificultad: áreas silvestres importantes que estaban protegidas por el peligro de la malaria quedarán expuestas al desarrollo irresponsable.

Sin duda he invertido demasiado tiempo en este ejemplo aparentemente simple, sólo para exponer algunas de sus complicaciones. Puede esperarse que surjan complicaciones análogas dondequiera que se efectúe una transición tecnológica para reducir el impacto sobre el medio ambiente, sea en la producción industrial, la extracción de minerales, la producción de alimentos o la generación de energía.

Al igual que la reconversión de las industrias militares en industrias civiles, la transición tecnológica requiere una ayuda financiera y la readaptación de los trabajadores a medida que las oportunidades se cierran para una clase de empleo y se abren para otras. Sería aconsejable que los políticos consideraran los retos planteados por estas reconversiones. Así, el dejar de fabricar agentes químicos para la guerra podría contemplarse de la misma manera que el desmantelamiento de la explotación forestal en los antiguos bosques del noroeste de los Estados Unidos. Por otra parte, estas cuestiones políticas vuelven a surgir cuando la sociedad intenta reducir el consumo de productos perjudiciales para la salud, sean legales como el tabaco o ilegales como la cocaína.

No obstante, en cuanto a exigencias, estas tres formas de reconversión plantean problemas algo diferentes. En el caso de las armas químicas, el reto principal era persuadir a los gobiernos de no volver a encargar su fabricación y sacar a la luz y destruir las existencias presentes. El tema de las drogas, en cambio, es objeto de agrias disputas. En el caso de la transición tecnológica para reducir el impacto sobre el medio ambiente, la cuestión es cuáles son los incentivos para el desarrollo y empleo de tecnologías inocuas. Esto nos conduce a la transición económica.

La transición económica

Si el aire o el agua son tratados como bienes libres en las transacciones económicas, entonces contaminarlos y degradar su calidad no cuesta nada. La actividad económica implicada se desempeña entonces a costa del medio ambiente y del futuro. Durante siglos, las autoridades han hecho frente a este tipo de problemas por medio de prohibiciones y multas, a menudo ineficaces. Hoy día se intenta en algunos sitios ejercer una reglamentación a gran escala, y se han conseguido algunos éxitos. Sin embargo, parece ser que para los gobiernos el modo más eficiente de tratar estas cuestiones es hacer pagar de alguna forma el coste de la restauración de la calidad. Esto es lo que los economistas llaman «internalización de externalidades». La reglamentación, con sus multas y otras penalizaciones, constituye en sí misma un recargo. Sin embargo, suele requerir acciones específicas por parte de los contaminadores, mientras que la internalización fomenta la restauración de la calidad, o su no degradación en primera instancia, de la manera más barata posible. Los ingenieros y administradores de la industria implicada son quienes prescriben las medidas que deben tomarse. La microgestión burocrática se hace innecesaria.

El pago de los costes reales es un elemento fundamental de la transición económica requerida para pasar de vivir en gran medida del capital de la naturaleza a vivir principalmente de las rentas de la naturaleza. Aparte de que suele ser mejor que la reglamentación, el recargo es desde luego mucho mejor que la mera exhortación. De entrada, reduce las ambigüedades.

Supongamos que nos comprometemos a premiar con la medalla verde los productos que tengan un menor impacto ambiental. Pronto nos encontraremos con un problema. Un detergente particular puede ser más bajo en fosfatos que otro y así producir menos eutrofización (crecimiento de algas) en los lagos, pero puede requerir un consumo energético mayor porque hay que usarlo con agua caliente. ¿Cómo se puede sopesar una consideración frente a otra? Si se prueba a imponer un recargo a los productores por la eutrofización causada por sus detergentes y, por otra parte, el coste de la energía que requiere un lavado se marca con claridad en el paquete, el consumidor puede decidirse en función del desembolso total, y el mercado determinará los precios. La medalla verde se hace innecesaria.

La gran dificultad a la hora de establecer el pago de los costes reales es, naturalmente, estimarlos. Hemos discutido ya cómo los economistas nunca han conseguido un éxito pleno a la hora de abordar problemas sutiles relacionados con la calidad y la irreversibilidad, cuestiones análogas a las que surgen en conexión con la segunda ley de la termodinámica en el marco de la ciencia natural. Tales problemas pueden, por supuesto, sacarse a relucir en el ruedo político y tratarse únicamente como asuntos de opinión pública, pero a largo plazo seguramente la ciencia tendrá también algo que decir. Mientras tanto, lo más simple es estimar el coste de reponer lo que se ha perdido. Puede que sea necesario algún tipo de prohibición estricta sobre lo que es irreemplazable, pero en los demás casos el logro de una calidad sostenible está estrechamente ligado a la idea de pagar para restaurar la calidad perdida, y la definición de calidad será competencia de la ciencia en interacción con la opinión pública.

Un aspecto fundamental de cualquier programa de pago de costes reales es la eliminación de subsidios para actividades económicas destructivas, muchas de las cuales serían totalmente antieconómicas si no fuera por tales subsidios. En la memoria de la Comisión Mundial de Medio Ambiente y Desarrollo (la comisión Brundtland), compuesta por distinguidos hombres de Estado de muchas partes del mundo, su brillante secretario general, el canadiense Jim MacNeill, se encargó de señalar que, para ver lo que está pasando con el medio ambiente, no hay que fijarse tanto en las actividades del ministerio de Medio Ambiente como en las del ministerio de Finanzas y en los presupuestos generales. Es aquí donde hay que buscar los subsidios destructivos para, no sin grandes obstáculos políticos, eliminarlos.

La discusión sobre presupuestos conduce directamente a la cuestión de si los procedimientos de contabilidad nacionales incluyen la merma del capital natural. Por lo general no. Si el presidente de un país tropical, a cambio de un soborno, hace un contrato con una compañía maderera extranjera para talar buena parte de los bosques de la nación por poco dinero, en las cuentas de la administración pública este dinero, incluido el soborno si es que no va a parar a un banco suizo, aparecerá como parte de los ingresos nacionales, pero la desaparición de los bosques, con todos sus beneficios y potencial, no se contabilizará entre las pérdidas. No son sólo los países tropicales los que venden sus bosques a un precio demasiado bajo, como lo atestigua el destino de los bosques húmedos templados de la costa noroeste del Pacífico estadounidense, la Columbia Británica y Alaska.

Está claro que la reforma de los sistemas de contabilidad de la administración pública es una necesidad prioritaria en todos los países. Por fortuna, los esfuerzos para acometer esta reforma han comenzado ya en algunos sitios. Nuestro ejemplo también deja claro que la lucha contra la corrupción es un elemento clave en el logro de la transición económica.

Otro indicador del grado de inquietud acerca de la disminución del capital de la naturaleza es la tasa de depreciación. Por lo que sé, el Banco Mundial, en la financiación de proyectos de gran impacto sobre el medio ambiente, todavía aplica una depreciación del 10 por ciento por año. Si esto es cierto, significa que la pérdida de una gran parte del patrimonio natural al cabo de treinta años es descontada por un factor de 20. El patrimonio natural de la próxima generación se valora en un 5 por ciento del valor actual asignado, si es que se tiene en cuenta.

La tasa de depreciación, en esta forma, es una medida de lo que se ha dado en llamar equidad intergeneracional, un concepto crucial para la noción de calidad sostenible. Desvalorizar el futuro demasiado rápidamente equivale a robarlo. Si se generaliza un poco más la noción de tasa de depreciación, puede servir para sintetizar mucho de lo que se entiende por sostenibilidad.

La transición social

Algunos economistas subrayan la importancia del posible conflicto entre la equidad intergeneracional y la equidad intrageneracional, esto es, la preocupación por el futuro y la preocupación por la pobreza actual, que hace necesaria la explotación de algunos recursos para asegurar la supervivencia. Aunque parte de la degradación actual de la biosfera se debe a la lucha por la vida de los que viven en condiciones miserables, una buena parte puede atribuirse al despilfarro de recursos por parte de los ricos. Sin embargo, gran parte de ella tiene que ver también con proyectos a gran escala que supuestamente sirven, por ejemplo, para ayudar a la población rural de un país en desarrollo, pero a menudo, si es que lo hacen, de una manera bastante ineficiente y destructiva. En contraste, esas mismas personas pueden recibir ayuda de un modo más efectivo a través de la suma de pequeños esfuerzos aplicados localmente; un ejemplo es la práctica conocida como micropréstamo.

En el micropréstamo, se establece una institución financiera dedicada a conceder préstamos de escasa cuantía a los propietarios locales, muchos de ellos mujeres, para fundar pequeñas empresas que ofrezcan un medio de vida local a un puñado de personas. Con frecuencia tales negocios crean empleos relativamente no destructivos y contribuyen tanto a la equidad intergeneracional como a la intrageneracional. Por fortuna, esta práctica de apoyo a una economía sostenible se está extendiendo cada vez más.

Es difícil entender cómo puede conseguirse una calidad de vida sostenible a largo plazo cuando está tan desigualmente repartida, cuando hay tantas personas que pasan hambre, carecen de hogar o mueren en la juventud a causa de alguna enfermedad, conscientes de que en otras partes hay miles de millones de personas que llevan una existencia mucho más confortable. Está claro que la sostenibilidad requiere acciones a gran escala orientadas hacia la equidad intrageneracional. Como en el caso del micropréstamo, a menudo hay más sinergia que conflicto entre equidad intergeneracional y equidad intrageneracional. Las políticas que en verdad ayudan a la población rural de los países en desarrollo son mucho más compatibles con la preservación de la naturaleza de lo que se suele pretender. Las políticas que sirven para combatir efectivamente la pobreza urbana son precisamente las que incluyen disposiciones encaminadas a evitar catástrofes medioambientales urbanas. Tales políticas incluyen también medidas para resolver los problemas rurales que están causando emigraciones en masa a las ciudades, en su mayoría ya atestadas. De hecho, está claro que la transición social debe incluir el alivio de algunos de los problemas más graves de las megalópolis.

Hoy día, todavía más que en el pasado, ninguna nación puede abordar problemas que afecten a la actividad económica urbana o rural sin tener en cuenta los asuntos internacionales. La aparición de la economía global es uno de los rasgos dominantes del escenario contemporáneo, y el deseo de participar más activamente en dicha economía es una de las fuerzas principales que influyen en la política de gobiernos e intercambios comerciales en todo el mundo. Junto con el transporte rápido, las comunicaciones a escala planetaria y los efectos sobre el medio ambiente global, la importancia de los temas económicos globales hace que sea esencial un mayor grado de cooperación mundial para tratar con las serias cuestiones a las que se enfrenta la totalidad del género humano. Esto nos lleva a la transición institucional.

La transición institucional

La necesidad de cooperación a escala regional y global no se restringe a los temas de medio ambiente, ni tampoco a los económicos. El mantenimiento de la paz y la seguridad internacional es,

por lo menos, igual de importante.

Desde hace poco, con la disolución de la Unión Soviética y el «bloque soviético» de naciones, y con un mayor grado de cooperación por parte de China, las instituciones mundiales, incluidos los órganos de las Naciones Unidas, pueden funcionar con más eficiencia que antes. Para la ONU es ahora rutinario organizar la supervisión de unas elecciones o promover negociaciones para frenar una guerra civil. Las actividades para el mantenimiento de la paz están progresando en muchas partes del mundo. Los resultados no son ni mucho menos satisfactorios, pero por lo menos el proceso está comenzando a afianzarse.

Mientras tanto, la cooperación transnacional está tomando forma de muchas otras maneras y, necesariamente, el papel del Estado se está debilitando cada vez más en un mundo donde existen tantos fenómenos importantes por encima de las fronteras nacionales. En muchas esferas de la actividad humana funcionan desde hace largo tiempo instituciones transnacionales y hasta universales (o casi), tanto de carácter formal como informal. Ahora hay muchas más. Todas ellas contribuyen de algún modo a canalizar la competencia dentro de modelos sostenibles y la atemperan a base de cooperación. Unas son más importantes o más efectivas que otras, pero todas tienen alguna trascendencia. Son ejemplos la red de tráfico aéreo, la Unión Postal Internacional, la Convención sobre Frecuencias de Emisión, la Interpol, los tratados sobre aves migratorias, la CITES (Convention on International Trade in Endangered Species), la Convención sobre Armas Químicas, la Unión Internacional de Física Pura y Aplicada, el Consejo Internacional de Organizaciones Científicas, los congresos mundiales de matemáticas, astronomía, antropología, psiquiatría, etc., el PEN (organización internacional de escritores), instituciones financieras como el Banco Mundial y el Fondo Monetario Internacional, corporaciones multinacionales desde McDonald’s hasta IBM, agencias de la ONU como WHO, UNEP, UNDP, UNFPA, UNICEF y UNESCO, y Cruz Roja Internacional. Por otro lado, no habría que ignorar la creciente importancia del inglés como lenguaje internacional.

Poco a poco, sobre una base global o altamente transnacional, la especie humana está comenzando a luchar contra algunos de los problemas que plantea la gestión de la biosfera y de las actividades humanas que se desarrollan en ella. Aquí el efecto del cambio de situación en la antigua Unión Soviética y en la Europa del Este es extremadamente esperanzador. El resultado es que ahora se ha hecho probable la cuasiuniversalidad en numerosas actividades para las que antes apenas podía esperarse nada parecido.

Además, se han puesto en marcha negociaciones sobre asuntos generales de carácter global — aquellos aspectos del medio ambiente que no se reconocen como patrimonio de nadie, y por lo tanto patrimonio de todos, cuya explotación egoísta sin ninguna clase de cooperación internacional sólo puede llevar a resultados negativos para todas las partes—. Son ejemplos obvios los océanos, el espacio y la Antártida.

Los acuerdos entre países más y menos desarrollados pueden seguir el modelo del contrato planetario, del que ya hablamos en conexión con la conservación de la naturaleza. Aquí asume un significado más general: la transferencia de recursos de los países ricos a los pobres conlleva la obligación para estos últimos de tomar medidas que hagan progresar la sostenibilidad en sentido amplio, es decir, desde la no proliferación nuclear hasta la protección de áreas salvajes. (Otra manifestación del contrato planetario es que los aparatos eléctricos en los países templados compensen sus emisiones de dióxido de carbono pagando una cuota destinada a preservar los bosques tropicales.)

Sin embargo, el problema de los particularismos destructivos —la competencia encarnizada y a menudo violenta entre pueblos de diferente lengua, religión, raza, nación o cualquier otra cosa— se ha agudizado aún más de lo habitual en los últimos años, especialmente tras la rotura de algunas de las ligaduras impuestas por ciertos regímenes autoritarios. Decenas de conflictos violentos de carácter étnico o religioso están en curso en diferentes partes del globo. Fundamentalismos de diverso cuño están a la orden del día. El mundo actual experimenta simultáneamente una tendencia hacia la unidad y otra hacia la fragmentación.

Ya hemos mencionado que, por lo que parece, ninguna diferencia es demasiado pequeña para provocar la división de la gente en grupos violentamente antagónicos. Pensemos, por ejemplo, en el agrio conflicto que se desarrolla en Somalia. ¿Diferencias lingüísticas? No, todos hablan somalí. ¿Diferencias religiosas? Virtualmente todos son musulmanes. ¿Diferentes sectas islámicas? No. ¿Diferencias entre clanes? Las hay, pero no crean demasiados problemas. La guerra es principalmente un asunto de subclanes dominados por señores de la guerra, cuyas rivalidades se han desatado tras el hundimiento del orden legal.

La transición ideológica

¿Hacia dónde nos conducirán estas tendencias? Si se da rienda suelta a nuestra propensión anacrónica hacia el particularismo destructivo, tendremos rivalidades militares, problemas demográficos y una competencia por los recursos que hará difícil o incluso imposible el logro de una calidad de vida sostenible. Es necesaria una radical transición ideológica que comprenda la transformación de nuestras maneras de pensar, nuestros esquemas, nuestros paradigmas, si es que queremos acercarnos a la sostenibilidad en nuestras relaciones mutuas, por no hablar de nuestras interacciones con el resto de la biosfera.

La investigación científica aún no ha dejado claro hasta qué punto las actitudes humanas hacia las personas percibidas como diferentes (y hacia los otros organismos) están gobernadas por tendencias hereditarias desarrolladas hace tiempo en el curso de la evolución biológica. Puede que hasta cierto punto nuestra propensión a formar grupos mutuamente intolerantes y a destruir el medio ambiente de manera innecesaria tenga ese origen. Podría tratarse de tendencias que fueron adaptativas en el pasado, pero que han dejado de serlo en un mundo de interdependencia, armas destructivas y una capacidad para la degradación de la biosfera incrementada en grado sumo. La evolución biológica es demasiado lenta para responder a tales cambios. Pero sabemos que la evolución cultural, mucho más rápida, puede modificar las tendencias biológicas.

Los sociobiólogos subrayan que nosotros los humanos, como otros animales, heredamos una tendencia a protegernos tanto a nosotros mismos como a nuestros parientes cercanos, de modo que tanto nosotros como ellos sobrevivamos para procrear y transmitir parte de nuestros genes comunes. Pero en los seres humanos ese instinto promotor de adaptación inclusiva está profundamente transformado por la cultura. Un sociobiólogo, al invocar la imagen de alguien saltando a un río para salvar a otra persona de las fauces de un cocodrilo, argumentaría que tal «altruismo» es más probable cuando la otra persona es un pariente cercano. Un antropólogo cultural podría señalar que en muchas tribus ciertos parientes, incluso muy lejanos, son hermanos, padres o hijos «de clase», que son tratados en muchos aspectos como si en verdad fueran parientes cercanos. Quizá los miembros de tales tribus están dispuestos a arriesgar su vida por sus hermanos y hermanas de clase simplemente porque quieren. En cualquier caso, los sociobiólogos admiten ahora que los modelos de comportamiento altruista en el hombre están afectados en gran medida por la cultura. Una cierta disposición a arriesgar la vida propia por otro ser humano puede extenderse fácilmente a todos los miembros de la tribu.

Este comportamiento se da también en niveles de organización superiores. A escala de nación, se conoce como patriotismo. A medida que las personas se han ido agregando en sociedades cada vez más grandes, el concepto de «nosotros» se ha ido ampliando. (Desafortunadamente, las tensiones pueden revelar puntos débiles en el tejido social que acaban causando su fragmentación en unidades menores. Esto es lo que ha pasado, por ejemplo, en la vecindad de Sarajevo, donde un residente se expresaba así: «Hemos vivido al lado de esa gente durante cuarenta años, hasta nos hemos casado con ellos, pero ahora nos damos cuenta de que no son del todo humanos».) A pesar de tales reveses, es innegable que la tendencia es hacia un sentido de la solidaridad cada vez más inclusivo.

La cuestión ideológica más importante es si, en una escala de tiempo reducida, ese sentido de la solidaridad puede abarcar al conjunto de la humanidad y también, en cierta medida, al resto de organismos que componen la biosfera y a los ecosistemas de los que todos formamos parte. ¿Es posible que los intereses provincianos y a corto plazo se vean crecientemente acompañados de intereses globales y a largo plazo? ¿Puede experimentar la conciencia de familia una evolución cultural suficientemente rápida hacia la conciencia planetaria?

Cuando en él pasado se ha alcanzado la unidad política, casi siempre ha sido a través de las conquistas, muchas veces seguidas de intentos de suprimir la diversidad cultural, pues diversidad cultural y rivalidad étnica son dos caras de la misma moneda. Sin embargo, para satisfacer el requerimiento de calidad sostenible la evolución hacia la conciencia planetaria debe acomodar la diversidad cultural.

El género humano necesita unidad en la diversidad, de modo que las diversas tradiciones evolucionen para permitir la cooperación y la consecución de las muchas transiciones hacia la sostenibilidad necesarias. La comunidad es esencial para las actividades humanas, pero sólo las comunidades motivadas para el trabajo en común es probable que sean adaptativas en el mundo futuro.

Mientras tanto, la diversidad cultural humana ha dado lugar a una multiplicidad de ideologías o paradigmas, esquemas característicos de las maneras de pensar de uno a otro lado del globo. Algunas de estas maneras de ver el mundo, incluyendo concepciones particulares de lo que es la buena vida, pueden hacer más corto el camino hacia la calidad sostenible. Es deseable que tales actitudes se extiendan más, incluso aunque la diversidad cultural se resienta por el declive de actitudes con consecuencias más destructivas. Como siempre, la preservación de la diversidad cultural no sólo puede engendrar paradojas, sino entrar en conflicto con las otras metas.

Hace unos años asistí a una notable conferencia impartida en UCLA por Václav Havel, entonces presidente de la pronta a dividirse República Federada Checa y Eslovaca, y ahora presidente de la República Checa. La conferencia trataba de la degradación medioambiental que había sufrido su país en las últimas décadas, con serios efectos sobre la salud humana. Para él el culpable era el antropocentrismo, especialmente esa filosofía que presupone que nosotros los humanos somos los dueños del planeta y tenemos el juicio suficiente para saber qué hacer con él. Se lamentaba de que ni los codiciosos capitalistas ni los dogmáticos comunistas tuviesen el suficiente respeto por el sistema más amplio del que nosotros no somos más que una parte. Havel, por supuesto, es escritor y defensor de los derechos humanos además de político. Otros políticos más ordinarios se guardan de atacar el antropocentrismo, pues a fin de cuentas los votantes son humanos. Pero sería ciertamente saludable para nuestra especie atribuir un valor intrínseco a la naturaleza y no sólo contemplarla como algo útil para un primate particular que se califica a sí mismo como sapiens.

La transición informacional

El tratamiento, a escala nacional y transnacional, de cuestiones medioambientales y demográficas, problemas sociales y económicos y asuntos de seguridad internacional, junto con la fuerte interacción entre todo ello, requiere una transición tanto en el conocimiento en sí como en la difusión del mismo. Podemos llamar a esto transición informacional. Aquí tienen que contribuir las ciencias naturales, la tecnología, las ciencias del comportamiento y profesiones como el derecho, la medicina, la enseñanza y la diplomacia, así como, naturalmente, el gobierno y la empresa privada. Sólo con un mayor grado de comprensión, tanto entre la gente corriente como entre la élite, acerca de las complejas cuestiones que afronta la humanidad cabe alguna esperanza de alcanzar una calidad de vida sostenible.

El conocimiento especializado no basta. Por supuesto, hoy día la especialización es necesaria. Pero también lo es la integración del conocimiento especializado en un todo coherente, como ya hemos discutido. Es esencial, por lo tanto, que más que nunca la sociedad conceda un mayor valor a los estudios integradores, necesariamente toscos, que intentan abarcar simultáneamente todos los rasgos importantes del conjunto de una situación, además de sus interacciones, por medio de algún modelo o simulación aproximados. Algunos de los primeros intentos de echar un vistazo a la totalidad han quedado desacreditados, en parte porque era demasiado pronto y en parte porque de los resultados se sacaron demasiadas conclusiones. Esto no debería disuadir a la gente de volver a intentarlo, pero con la modestia que corresponde a lo que necesariamente serán resultados muy provisionales y aproximados.

Un defecto adicional de estos primeros estudios —como Límites del crecimiento, el primer informe del club de Roma— era que muchos de los supuestos y magnitudes críticas que determinaban el resultado no variaban paramétricamente, de manera que un lector pudiese comprobar las consecuencias de una variación en los postulados o los números de partida. Hoy día, con la posibilidad de disponer de poderosos ordenadores, las consecuencias de la variación de los parámetros pueden explorarse con mucha mayor facilidad. Puede examinarse la sensibilidad de los resultados a los diferentes supuestos, con lo que la estructura del estudio se hace así más transparente. Además, parte del estudio puede tomar la forma de un juego, como SimCity o SimEarth, comercializados por Maxis Corporation bajo la dirección de Will Wright. Los juegos permiten a cualquier crítico rehacer los postulados de partida a su gusto y comprobar los resultados.

En su libro The Art of the Long View (El arte de ver más lejos), Peter Schwartz relata cómo hace algunos años el equipo de planificación de la Royal Dutch Shell Corporation llegó a la conclusión de que el precio del petróleo pronto bajaría en picado, y recomendó a la compañía actuar en consecuencia. Los directivos se mostraron escépticos, arguyendo que las presunciones de los planificadores no les decían nada. Entonces se optó por presentarles el análisis en forma de juego, de modo que los directivos pudieran, por así decirlo, tomar el mando y alterar, dentro de lo razonable, los datos de entrada a su juicio equivocados. Según cuenta Schwartz, el resultado principal continuó siendo el mismo, después de lo cual los directivos se convencieron de que había que prepararse para un período de rebaja en los precios del petróleo. Algunos de los protagonistas tienen una versión distinta de los hechos, pero en cualquier caso la historia es una hermosa ilustración de la importancia de la transparencia en la construcción de modelos. A medida que éstos incorporan cada vez más rasgos del mundo real y, en consecuencia, se vuelven más complejos, la labor de hacerlos transparentes, de dejar claros los supuestos de partida y mostrar cómo podrían variarse, se convierte en un reto y, a la vez, en algo cada vez más fundamental.

Los que participamos en estudios como el Proyecto 2050, cuya meta es trazar posibles vías que conduzcan a un mundo más sostenible a mediados del próximo siglo, tenemos que encarar cuestiones difíciles. ¿Cómo pueden completarse estas transiciones, si es que se puede, en los próximos cincuenta a cien años? ¿Podemos esperar entender, siquiera toscamente, la compleja interacción entre las diversas transiciones y, especialmente, las cuestiones que surgen de su delicada cronología relativa y absoluta? ¿Hay alguna esperanza de que se tenga lo bastante en cuenta la amplia variabilidad de circunstancias en las diversas partes del mundo? ¿Hay otras transiciones, o maneras de enfocar el conjunto de cuestiones, que sean más importantes? Estos temas conciernen al periodo, hacia mediados del siglo XXI, en que las diversas transiciones podrían haberse cumplido en parte o al menos estar en marcha. Pensar sobre ésta era de una manera fructífera es difícil, pero no necesariamente imposible. Como decía Eilert Lóvborg, el personaje de Ibsen en Hedda Gabler, cuando alguien le mostraba su sorpresa por el hecho de que su libro de historia tuviese una continuación describiendo el futuro, «se pueden decir una o dos cosas sobre él igualmente».

En cuanto al futuro lejano, ¿qué condiciones globales podrían imperar en la segunda mitad del siglo que viene, que se acercaran realmente a la calidad sostenible? ¿Cómo nos imaginamos tal situación? ¿Qué veríamos, oiríamos y sentiríamos si estuviéramos allá?

Deberíamos intentar entrever algo, especialmente un mundo donde finalmente predomine el crecimiento en calidad sobre el crecimiento en cantidad. Podemos imaginar un mundo en el que, aunque suene utópico, el State of the World Report y el World Resources Report no diesen una impresión peor cada año, donde la población se estuviese estabilizando en la mayoría de sitios, la miseria estuviera desapareciendo, la riqueza estuviese mejor repartida y se hiciesen intentos serios de hacer pagar los costes reales, donde instituciones transnacionales diversas (y también nacionales y locales) comenzaran a abordar las complejas cuestiones relacionadas con la sociedad humana y el resto de la biosfera, y las ideologías que favoreciesen la sostenibilidad y la conciencia planetaria estuviesen ganando adeptos, a la vez que los enfrentamientos étnicos y los fundamentalismos de toda índole estuviesen desapareciendo como fuerzas divisorias, sin que por ello dejara de existir una gran diversidad cultural. Apenas podemos esperar aproximarnos a un mundo semejante si no somos ni siquiera capaces de imaginar cómo sería o estimar sobre una base cuantitativa cómo funcionaría.

De las tres escalas de tiempo, lo más difícil, naturalmente, es hacer meditar a la gente sobre la visión a largo plazo de un mundo más sostenible, pero es vital que venzamos nuestra renuencia a hacemos una imagen concreta de ese mundo. Sólo entonces puede nuestra imaginación escapar de los confines de las prácticas y actitudes que ahora causan o amenazan causar tantos problemas e inventar maneras mejores de relacionamos con los demás y con el resto de la biosfera.

A la vez que intentamos hacemos una idea de un futuro sostenible, debemos también preguntamos qué sorpresas, tecnológicas, psicológicas o sociales, podrían hacer el futuro lejano totalmente diferente de lo que podamos haber anticipado hoy. Para ocuparse de esta cuestión se requiere un equipo especial de aventureros de la imaginación.

Este mismo equipo podría también reflexionar sobre qué problemas serios completamente nuevos podrían surgir en un mundo donde muchos de los peores temores actuales se hayan aliviado algo. Hace sólo unos años, la mayoría de expertos no había previsto que la guerra fría fuese a dejar paso a una nueva era con problemas diferentes, pero incluso los pocos que entrevieron algo no se atrevieron a especular seriamente sobre las preocupaciones que reemplazarían las cuestiones familiares hasta entonces dominantes.

¿Y qué podemos decir de las próximas décadas? ¿Qué políticas y actividades en el futuro inmediato pueden contribuir a la posibilidad de aproximarse más adelante a la calidad sostenible? No es en absoluto difícil organizar discusiones sobre el futuro cercano, y algunos de los problemas que afrontamos a corto plazo se están haciendo claros para muchos observadores. Quizá la lección principal que se puede extraer de la experiencia contemporánea es una a la que aludíamos al hablar del micropréstamo. Es la importancia de las iniciativas de abajo arriba en oposición a las de arriba abajo. Si la población local está profundamente implicada en un proceso, si contribuye a organizarlo y tiene una participación perceptible, especialmente económica, en los beneficios, entonces el proceso suele tener mayores posibilidades de triunfar que si es impuesto por una burocracia distante o un explotador poderoso. En su labor de ayuda a que en las áreas tropicales se alcancen objetivos en la preservación de la naturaleza junto con un desarrollo económico al menos parcialmente sostenible, los conservacionistas han comprobado que lo más rentable es invertir en los grupos y autoridades locales, particularmente en la instrucción de los líderes locales.

Aunque es bien fácil persuadir a la gente para discutir sobre cuestiones a plazo medio —plazo en el que tienen que haberse completado en gran parte las distintas transiciones si es que se quiere llegar a alguna forma de sostenibilidad— la extraordinaria complejidad del desafío puede resultar desalentadora. Hay que considerar todas las transiciones, cada una con un carácter y ritmo propios que hay que determinar, quizá diferentes en diferentes partes del mundo, y todas fuertemente ligadas entre sí. Aun así, esta misma complejidad puede conducir a una forma de simplicidad. En el marco de la ciencia física (mucho menos difícil de analizar, es cierto, pero de donde todavía se pueden sacar algunas lecciones) es indudable que en la vecindad de una transición, digamos de gas a líquido, cerca de una singularidad matemática, hay sólo unos pocos parámetros cruciales de los que depende la naturaleza de dicha transición. Estos parámetros no siempre pueden caracterizarse de antemano, sino que deben surgir de un cuidadoso estudio del problema en su conjunto. En general es cierto que el comportamiento de los sistemas no lineales altamente complejos puede mostrar simplicidad, pero una simplicidad que acostumbra a ser emergente y no obvia de entrada.

Los estudios de política integrada sobre las posibles vías hacia un mundo más sostenible pueden ser tremendamente valiosos. Pero debemos guardarnos de tratarlos en general como «prótesis para la imaginación», y no atribuirles más validez de la que probablemente poseen. Los intentos de encajar el comportamiento humano, y especialmente los problemas sociales, dentro del lecho de Procusto de algún marco matemático necesariamente estrecho ya han causado demasiados problemas. La ciencia de la economía, por ejemplo, ha sido utilizada a menudo de esta manera con consecuencias desafortunadas. Por otro lado, las ideologías destructivas de la libertad o el bien humanos han sido justificadas a menudo con argumentos científicos poco rigurosos, especialmente los basados en analogías entre ciencias distintas. El darwinismo social predicado por algunos filósofos de la política en el siglo pasado es uno de los muchos ejemplos, y no el peor.

Sin embargo, abordados con el espíritu que les corresponde, una multiplicidad de estudios políticos toscos pero integradores, que impliquen no sólo proyección lineal sino evolución, simulaciones y juegos altamente no lineales, puede proporcionar una modesta ayuda en la generación de una función de previsión colectiva para el género humano. Un documento preliminar del Proyecto 2050 lo expresa así: Estamos todos en una situación parecida a conducir un vehículo rápido por la noche sobre un terreno desconocido, áspero, lleno de baches y con precipicios en los alrededores. Cualquier clase de faro, incluso uno débil y vacilante, puede servir para evitar los peores desastres.

Si la humanidad se equipa de algún modo con una medida de previsión colectiva —cierto grado de comprensión de las historias ramificadas del futuro— habrá tenido lugar un cambio altamente adaptativo, pero todavía no un suceso umbral. La consecución de las transiciones hacia una mayor sostenibilidad, sin embargo, sí que lo sería. En particular, la transición ideológica implica un paso capital para la humanidad hacia la conciencia planetaria, quizá con la ayuda de la sabia gestión de adelantos técnicos de momento sólo débilmente perceptibles. Una vez completadas las transiciones, el conjunto de la humanidad —junto con el resto de organismos que habitan el planeta— podrá funcionar, mucho más que ahora, como un sistema complejo adaptativo compuesto y ricamente diverso.

Capítulo 23
Postfacio

En este breve capítulo intento responder a la necesidad de una especie de sumario, no de cada uno de los temas tratados a lo largo de todo el libro, sino del tema central de la simplicidad, la complejidad y los sistemas complejos adaptativos, el tema que conecta el quark con el jaguar y éstos con la humanidad.

El quark y el jaguar no es un tratado. No es un libro técnico, y se introduce en gran número de áreas que no puede explorar exhaustivamente o en profundidad. Por otra parte, muchos de los trabajos que están descritos con algún detalle son trabajos en curso, lo que quiere decir que aunque fueran tratados de modo más completo, con ecuaciones y toda la jerga científica pertinente, todavía quedarían muchas cuestiones importantes sin responder. Evidentemente, la función principal del libro es estimular la reflexión y la discusión.

A lo largo de todo el texto la idea de la interacción entre las leyes fundamentales de la naturaleza y la intervención del azar está siempre presente. Las leyes que gobiernan las partículas elementales (quarks incluidos) están comenzando a revelar su simplicidad. La teoría cuántica unificada de todas las partículas y fuerzas puede muy bien estar al alcance de la mano en la forma de teoría de supercuerdas. Esta elegante teoría se basa en una variante del principio de autoconsistencia, que requiere que cualquier partícula elemental sea describible a partir de las otras de modo autoconsistente. La otra ley fundamental de la naturaleza es el estado inicial simple del universo al comienzo de su expansión. Si la propuesta de Hartle y Hawking es correcta, entonces ese estado inicial puede expresarse en términos de la teoría de partículas unificada, y las dos leyes básicas se transforman en una sola.

El azar entra necesariamente en escena porque las leyes fundamentales son mecanocuánticas, y la mecánica cuántica proporciona sólo probabilidades para las historias alternativas no detalladas del universo. El grado de detalle, o resolución, debe ser lo bastante bajo como para que las probabilidades estén bien definidas. Esto permite además una descripción de la naturaleza aproximadamente clásica y determinista, con frecuentes excursiones cortas (y ocasionalmente largas) fuera de la clasicidad. Dichas excursiones, especialmente las más largas, tienen como resultado la ramificación de las historias. De hecho todas las historias no detalladas alternativas forman un árbol o «jardín de los caminos que se bifurcan» denominado «dominio cuasiclásico». La indeterminación de la mecánica cuántica va, pues, mucho más allá del famoso principio de incertidumbre de Heisenberg. Por otra parte, en los sistemas no lineales esta indeterminación puede amplificarse en virtud del fenómeno del caos, lo que significa que el resultado de un proceso es arbitrariamente sensible a las condiciones iniciales, como pasa a menudo, por ejemplo, en meteorología. El mundo que vemos a nuestro alrededor corresponde al dominio cuasiclásico, pero estamos restringidos a una versión muy tosca de él debido a las limitaciones de nuestros sentidos e instrumentos. Dado lo mucho que queda oculto a nuestra vista, el elemento de azar cobra aún más importancia.

En ciertas ramas de la historia, y en ciertas épocas y lugares del universo, las condiciones son apropiadas para la evolución de sistemas complejos adaptativos. Éstos son sistemas que captan información en la forma de un flujo de datos y perciben regularidades en el mismo (como se ilustra en el diagrama de la Figura 2), tratando el resto del material como aleatorio. Dichas regularidades son comprimidas en un esquema empleado para describir el mundo, predecir hasta cierto punto el futuro y prescribir el comportamiento del propio sistema complejo adaptativo. El esquema puede experimentar cambios que producen multitud de variantes que compiten entre sí. El resultado de esta competencia depende de las presiones selectivas, que representan la retroacción del mundo real. Estas presiones pueden reflejar la precisión de las descripciones y prescripciones, o hasta qué punto dichas prescripciones conducen a la supervivencia del sistema. Las presiones selectivas no están relacionadas con el «triunfo» de los esquemas por un conjunto de rígidas correlaciones, sino más bien por tendencias. Además, la respuesta a las presiones puede ser imperfecta. De este modo el proceso de adaptación de los esquemas conduce a resultados sólo aproximadamente «adaptativos» para el sistema. También pueden darse esquemas «no adaptativos».

A veces la inadaptación es sólo aparente, y surge porque algunas presiones selectivas importantes son pasadas por alto en la definición de lo que es adaptativo. En otros casos se dan situaciones genuinamente no adaptativas porque la adaptación es demasiado lenta para responder a las presiones selectivas cambiantes.

Los sistemas complejos adaptativos funcionan mejor en un régimen intermedio entre el orden y el desorden. T ales sistemas explotan las regularidades que proporciona el determinismo aproximado del dominio cuasiclásico, y al mismo tiempo se aprovechan de las indeterminaciones (describibles como ruido, fluctuaciones, calor, incertidumbre, etc.) que pueden ser de ayuda en la búsqueda de esquemas «mejores». La noción de adaptación o adecuación, que daría sentido a la palabra «mejor», suele ser difícil de concretar, en cuyo caso puede ser más útil concentrarse en las presiones selectivas en danza. En ocasiones puede definirse bien un grado de adaptación porque ésta es «exógena», impuesta desde fuera, como en el caso de un ordenador programado para buscar estrategias ganadoras en un juego como las damas o el ajedrez. Cuando la adaptación es «endógena», resultado de los caprichos de un proceso evolutivo sin ningún criterio externo para el éxito, suele estar muy mal definida. Pero la idea de un relieve adaptativo es útil, siempre y cuando se emplee sólo como metáfora. La variable adaptación corresponde a la altura (que arbitrariamente considero menor cuanto mayor es la adaptación) y todas las variables que especifican el esquema se distribuyen a lo largo de una línea o plano horizontal. La búsqueda de esquemas más adaptados se corresponde entonces con la exploración de una línea o superficie bidimensional irregular a la búsqueda de depresiones profundas. Como se ilustra en la Figura 19, esta búsqueda probablemente acabaría en una depresión relativamente somera si no fuera por una cierta cantidad de ruido apropiada (o calor, obedeciendo a lo que Seth Lloyd llama el principio de Goldilocks: ni demasiado caliente, ni demasiado frío, sólo lo justo). El ruido o calor puede sacar el sistema de una cuenca poco profunda y permitirle así acceder a otra más profunda en las cercanías.

La diversidad de sistemas complejos adaptativos existentes aquí en la Tierra se ilustra en el diagrama de la Figura 1, que muestra la tendencia de tales sistemas a dar origen a otros. Así, los sistemas terrestres, todos conectados de alguna manera con la vida, van desde las reacciones químicas prebióticas que originaron los primeros seres vivos, pasando por la evolución biológica y la evolución cultural de la humanidad, hasta los ordenadores equipados con circuitos o programas apropiados, e incluso posibles avances futuros tratados por la ciencia ficción, como seres humanos compuestos por la interconexión de cerebros individuales.

Cuando un sistema complejo adaptativo describe otro sistema (o a sí mismo) construye un esquema, abstrayendo del conjunto de datos las regularidades percibidas y expresándolas de forma concisa. La longitud de dicha descripción concisa de las regularidades de un sistema, por ejemplo a cargo de un observador humano, es lo que yo llamo la complejidad efectiva del sistema, que se corresponde con lo que solemos entender por complejidad tanto en la práctica científica como en el habla cotidiana. La complejidad efectiva no es intrínseca, sino que depende de la resolución y del lenguaje o código empleado por el sistema observador.

La complejidad efectiva, sea o no interna, es insuficiente por sí misma para describir las potencialidades de un sistema complejo, adaptativo o no. Un sistema puede ser relativamente simple y, en cambio, tener una alta probabilidad de evolucionar, en un intervalo de tiempo dado, hacia algo mucho más complejo. Es el caso, por ejemplo, de los seres humanos modernos. Cuando aparecieron no eran mucho más complejos que sus parientes cercanos los grandes monos, pero, dada la probabilidad tan alta que tenían de acabar desarrollando culturas de enorme complejidad, se puede decir que poseían una gran cantidad de lo que yo llamo complejidad potencial. De modo similar, cuando, muy pronto en la historia del universo, ciertas fluctuaciones de materia llevaron a la formación de las galaxias, la complejidad potencial de estas fluctuaciones era considerable.

La complejidad efectiva de un sistema o flujo de datos contrastaría con el contenido de información algorítmica, relacionado con la longitud de una descripción concisa de la totalidad del sistema o flujo de datos que incluya tanto las regularidades como los rasgos aleatorios. Cuando el contenido de información algorítmica es muy pequeño o está cerca del máximo posible, la complejidad efectiva se acerca a cero. La complejidad efectiva sólo puede ser grande en la región de contenido de información algorítmica intermedio. De nuevo el régimen interesante es el intermedio entre el orden y el desorden absolutos.

Un sistema complejo adaptativo descubre regularidades en el flujo de datos de entrada advirtiendo que ciertas partes del mismo tienen rasgos comunes. Las similaridades se miden por lo que se denomina información mutua entre las partes. En el mundo real las regularidades surgen de la combinación de leyes fundamentales simples con la intervención del azar, que puede producir accidentes congelados. Éstos son sucesos aleatorios de resultados particulares, aunque pudieran haber sido diferentes, y que tuvieron múltiples derivaciones. El origen común de todas ellas en un suceso aleatorio antecedente puede dar lugar a una gran cantidad de información mutua en un flujo de datos determinado. He puesto como ejemplo la llegada de Enrique VIII al trono de Inglaterra tras la muerte de su hermano mayor, resultando en la existencia de un enorme número de referencias al rey Enrique en monedas, documentos y libros. Todas estas regularidades surgen de un accidente congelado.

La mayor parte de accidentes, por ejemplo la gran mayoría de fluctuaciones a escala molecular, tiene lugar sin que se amplifiquen de manera que tengan repercusiones significativas, y no dejan tras de sí demasiada regularidad. Estos accidentes pueden contribuir a la fracción aleatoria del flujo de datos que llega a un sistema complejo adaptativo.

Con el paso del tiempo, la acumulación de accidentes congelados, en conjunción con las leyes fundamentales, produce regularidades. Así, sistemas de complejidad cada vez mayor tienden a surgir a través de la autoorganización, incluso en el caso de sistemas no adaptativos como galaxias, estrellas y planetas. Sin embargo, no todo aumenta de complejidad sin cesar, sino que más bien es la complejidad máxima la que tiene tendencia a aumentar. En el caso de los sistemas complejos adaptativos, dicha tendencia puede verse significativamente intensificada por las presiones selectivas que favorecen la complejidad.

La segunda ley de la termodinámica nos dice que la entropía (una medida del desorden) de un sistema cerrado tiene tendencia a aumentar o permanecer invariable. Por ejemplo, si un cuerpo caliente y un cuerpo frío entran en contacto (sin interaccionar demasiado con el resto del universo), el calor tiende a fluir del caliente al frío, reduciéndose la diferenciación ordenada de la temperatura en el sistema combinado.

La entropía es un concepto útil sólo cuando se aplica una cierta resolución a la naturaleza, de modo que ciertas clases de información sobre el sistema cerrado se contemplan como importantes y el resto se considera irrelevante y se ignora. La cantidad de información total no varía y, si está inicialmente concentrada en información importante, parte de ella tenderá a convertirse en información irrelevante que no se tiene en cuenta. A medida que esto ocurre la entropía, que equivale a la ignorancia de información importante, tiende a incrementarse.

Una clase fundamental de resolución es la que aportan las historias que componen un dominio cuasiclásico. Para el universo observado por un sistema complejo adaptativo, la resolución efectiva puede considerarse mucho más baja, pues el sistema sólo puede captar una cantidad de información relativamente pequeña sobre el universo.

A medida que pasa el tiempo el conjunto del universo va perdiendo cuerda, y la misma tendencia se observa en las partes relativamente independientes entre sí. Las diversas flechas del tiempo apuntan todas hacia delante, no sólo la que se corresponde con el incremento de entropía, sino también las relacionadas con la secuencia de causas y efectos, la emisión de radiaciones y la formación de registros (memorias incluidas) del pasado y no del futuro.

De vez en cuando hay quien, por alguna razón dogmática, rechaza la evolución biológica argumentando que la aparición de formas de vida cada vez más complejas viola de algún modo la segunda ley de la termodinámica. Naturalmente esto no es así, pues la evolución biológica no viola la segunda ley más de lo que lo hace la aparición de estructuras de complejidad creciente a escala galáctica. La autoorganización siempre puede producir orden local. Por otra parte, en la evolución biológica se puede ver cómo, a medida que los seres vivos se adaptan mejor a su entorno, se incrementa una especie de entropía «informacional» a la vez que se reduce una discrepancia informacional que recuerda la diferencia de temperatura entre un objeto frío y otro caliente. De hecho, todos los sistemas complejos adaptativos exhiben este fenómeno; el mundo real ejerce presiones selectivas sobre los sistemas y los esquemas tienden a responder ajustando la información que contienen de acuerdo con dichas presiones. La evolución, la adaptación y el aprendizaje por parte de los sistemas complejos adaptativos son todos aspectos de la pérdida de cuerda del universo.

Podemos preguntamos si el sistema en evolución y su entorno alcanzan un equilibrio, del mismo modo que un cuerpo caliente y uno frío acaban por alcanzar la misma temperatura. En ocasiones es así. Si se programa un ordenador para desarrollar estrategias en un juego determinado, cuando existe una estrategia óptima y la encuentra se acabó la búsqueda. Éste sería el caso del juego del tres en raya. Pero si el juego es el ajedrez, el ordenador podría descubrir la estrategia óptima algún día, pero hasta entonces esa estrategia es desconocida, y el ordenador continúa explorando en un enorme espacio abstracto de estrategias buscando una mejor que la anterior. Esta situación es muy común.

En unos pocos casos puede verse cómo, en el curso de la evolución biológica, un problema adaptativo parece haberse resuelto de una vez para siempre muy pronto en la historia de la vida, al menos en lo que se refiere al fenotipo. Los extremófilos que viven en el medio caliente, ácido y sulfuroso de las profundidades oceánicas en los límites entre placas tectónicas son probablemente muy similares, al menos metabólicamente, a los organismos que vivían en este mismo ambiente hace más de 3500 millones de años. Pero la mayoría de problemas propios de la evolución biológica no son como el juego del tres en raya, ni siquiera como el ajedrez, que sin duda será un problema resuelto algún día. En primer lugar, las presiones selectivas no son de ningún modo constantes. En la mayor parte de la biosfera el medio ambiente fisicoquímico está en continuo cambio. Por otro lado, en las comunidades naturales las diversas especies forman parte del entorno de las otras especies. Los organismos coevolucionan, y puede no haber ningún verdadero equilibrio alcanzable.

En diversos momentos y lugares parece llegarse a un equilibrio aproximado y temporal, incluso para comunidades enteras, pero al cabo de un cierto tiempo aparecen «puntuaciones», unas veces debidas a cambios fisicoquímicos y otras a un pequeño número de mutaciones que siguen a un largo periodo de «deriva», es decir, una secuencia de cambios genéticos que afectan sólo ligeramente al fenotipo sin comprometer la supervivencia del organismo. La deriva puede preparar el camino para cambios genotípicos muy pequeños pero capaces de causar importantes alteraciones fenotípicas.

De vez en cuando tales cambios genotípicos relativamente modestos pueden conducir a sucesos umbral, en los que surgen tipos completamente nuevos de organismos. Un ejemplo es la aparición de los eucariotas unicelulares, así llamados porque la célula posee un núcleo propiamente dicho y otros orgánulos —cloroplastos o mitocondrias— que se cree descienden de organismos originalmente independientes incorporados por la célula. Otro ejemplo es el origen de los animales y plantas multicelulares a partir de organismos unicelulares, presumiblemente por agregación, gracias a un invento bioquímico decisivo, una especie de adhesivo capaz de mantener unidas las células.

Cuando un sistema complejo adaptativo da lugar a una nueva clase de sistema complejo adaptativo de orden superior, sea por agregación o por cualquier otro mecanismo, esto puede considerarse un suceso umbral. Un ejemplo familiar es la evolución del sistema inmunitario de los mamíferos, cuyo funcionamiento recuerda el de la evolución biológica misma, pero a una escala temporal mucho más corta, ya que los invasores del organismo pueden ser identificados y combatidos en cuestión de horas o días, en comparación con los cientos de miles de años que se requieren muchas veces para la evolución de nuevas especies.

Muchos de los rasgos más visibles de la evolución biológica se encuentran también, en forma muy similar, en otros sistemas complejos adaptativos, como el pensamiento humano, la evolución social y la programación adaptativa. Todos estos sistemas exploran posibilidades abriendo nuevas vías, descubriendo puertas y, ocasionalmente, engendrando nuevos tipos de sistema complejo adaptativo. Al igual que surgen nuevos nichos ecológicos en la evolución biológica, en economía continúan descubriéndose nuevas formas de ganarse la vida, en la ciencia se inventan nuevas teorías, etc.

La agregación de sistemas complejos adaptativos en un sistema complejo adaptativo compuesto es un modo efectivo de crear un nuevo nivel de organización. El sistema compuesto consiste entonces en agentes adaptativos que construyen esquemas para considerar el comportamiento de los otros y obrar en consecuencia. Los sistemas económicos son un buen ejemplo, lo mismo que las comunidades ecológicas.

Tales sistemas compuestos están siendo intensamente investigados en diversos campos. Los resultados indican que dichos sistemas tienden a situarse en una zona de transición bien definida entre el orden y el desorden, donde se caracterizan por una adaptación eficiente y por una distribución de recursos que obedece a leyes potenciales. Esta zona recibe a veces la denominación, más bien metafórica, de «límite del caos».

No existe evidencia de que haya algo terriblemente especial en la formación de un sistema planetario como el sistema solar ni en el hecho de que incluya un planeta como la Tierra. Tampoco hay evidencia de que las reacciones químicas que iniciaron la vida en este planeta sean improbables, ni mucho menos. Es probable, por lo tanto, que los sistemas complejos adaptativos existan en algunos de los numerosos planetas dispersos por el universo y que al menos algunos de ellos compartan muchos de los rasgos de la evolución biológica terrestre y las formas de vida resultantes. Sin embargo, todavía se discute si la bioquímica de la vida es única, o casi, o si es sólo una de entre un gran número de posibilidades. En otras palabras, aún no está del todo claro si está determinada principalmente por la física o debe su carácter en gran parte a la historia.

Los cerca de 4000 millones de años de evolución biológica sobre la Tierra han producido, mediante el ensayo y el error, una gigantesca cantidad de información acerca de los diferentes modos de vida de los organismos en el seno de la biosfera. De modo similar, a lo largo de más de 50 000 años, los seres humanos modernos han desarrollado una extraordinaria cantidad de información sobre maneras de vivir, en interacción mutua y con el resto de la biosfera. Tanto la diversidad biológica como la cultural se encuentran ahora severamente amenazadas, y trabajar para su preservación es una tarea de importancia capital.

Pero la preservación de la diversidad cultural presenta algunas paradojas y conflictos con otras metas. Uno de los desafíos más difíciles es reconciliar esta diversidad con la creciente necesidad de unidad entre los pueblos, que se enfrentan ahora con problemas comunes a escala global. Otro es el representado por la hostilidad que evidencian algunas culturas localistas hacia la cultura secular, científica y universalizante; precisamente de estas culturas salen muchos de los más vigorosos defensores de la preservación de la diversidad cultural.

La conservación de la naturaleza y la salvaguardia de tanta diversidad biológica como sea posible son necesidades urgentes, pero estas metas parecen imposibles de alcanzar a largo plazo a menos que se contemplen dentro del marco más amplio de los problemas medioambientales en general, y éstos a su vez deben considerarse junto con los problemas demográficos, tecnológicos, económicos, sociales, políticos, militares, diplomáticos, institucionales, informacionales e ideológicos a los que la humanidad tiene que hacer frente. En particular, los desafíos planteados en todos estos campos pueden contemplarse en conjunto como la necesidad de llevar a cabo una serie de transiciones interconectadas hacia una situación más sostenible en el curso del siglo venidero. Una mayor sostenibilidad, si es que puede conseguirse, significaría una estabilización de la población, a escala global y regional, unas prácticas económicas que favorezcan el pago de costes reales, el crecimiento en calidad más que en cantidad y vivir de las rentas de la naturaleza más que de su capital, una tecnología que tenga un impacto ambiental relativamente escaso, un reparto más equitativo de la riqueza, especialmente en el sentido de hacer desaparecer la miseria, unas instituciones transnacionales más fuertes para tratar de los problemas globales urgentes, una opinión pública mucho mejor informada sobre los desafíos múltiples e interactivos de cara al futuro, y, quizá lo más importante y difícil de todo, el predominio de actitudes que favorezcan la unidad en la diversidad — cooperación y competencia no violenta entre las diferentes naciones y tradiciones culturales— así como una coexistencia sostenible con los organismos con los que compartimos la biosfera. Una tal situación parece utópica y quizá imposible de conseguir, pero es importante intentar construir modelos del futuro —no como anteproyectos, sino como estímulos para la imaginación— y ver si pueden esbozarse caminos que puedan conducir a ese mundo deseable y sostenible a finales del próximo siglo, un mundo en el que el conjunto de la humanidad y el resto de la naturaleza funcionen como un sistema complejo adaptativo a una escala mucho mayor de lo que lo hacen en la actualidad.


Notas:
[1] Instituto Tecnológico de California. (N. de los T.)