Ir al contenido

¿A más seguidores, más logro?: las matemáticas detrás de los ‘influencers’ y de las redes sociales

Sofía es una joven cuyo círculo de amigos más próximo está formado por Martín, Lucía, Lucas y Hugo, todos en su misma clase. Hugo tiene De la misma forma amistad con María, quien está en otra clase del mismo instituto. Esta chiquita red de amigos es ilustrada en la Figura 1. Cada pequeño círculo, llamado nodo (o bien vértice), representa a un miembro de la red, y las líneas que conectan a un par de nodos, llamadas conexiones (o bien aristas), representan la amistad entre ellos. Figura 1En el proceso para elegir al representante estudiantil del colegio Sofía apoyaba Ciertamente a un pretendiente, al paso que Martina apoyaba a otro distinto. Está claro al ver la red que Sofía podría movilizar el voto de sus 4 amigos, Mientras que Martina Sólo podría hacerlo con el de 2. El número de conexiones directas que cada nodo tiene en una red se llama el grado del nodo. De este modo, el grado de Sofía es 4, Entre tanto que el de Martina es 2. El grado de un nodo es una medida de la centralidad de éste, y captura la repercusión directa que un nodo tiene acerca de otros. Los grados de todos y cada uno de los nodos están en la Tabla 1. De consenso con esta medida Sofía es la persona más influyente respecto a sus contactos directos en la red. El grado de los nodos juega un papel fundamental en entender los procesos de propagación de epidemias. Un súper-propagador, por servirnos de un ejemplo, es un individuo con un altísimo grado en su red de contactos. Tabla 1Por otra comunicado, si Sofía le comunicara de manera directa a su círculo más íntimo una datos particular, María podría enterarse indirectamente de La misma Durante Hugo y entonces comunicárselo a sus amigos Mateo y Martina, quienes También adquirirían dicha datos de manera indirecta. Esta datos habría recorrido un trayecto de longitud 2 Desde Sofía hasta María y otro de longitud 3 hasta llegar a Mateo o bien Martina. Un sendero es una secuencia de nodos y conexiones distintas (no se admiten repeticiones) entre dos nodos cualesquiera de la red. Su longitud es el número de conexiones que hay que atravesar en dicho sendero. Entre dos nodos pueden existir más de un sendero. Por ejemplo, entre Sofía y María existen a su vez los caminos: Sofía-Lucía-Hugo-María de longitud 3, Sofía-Martín-Lucía-Hugo-María de longitud 4 y Sofía-Lucas-Martín-Lucía-Hugo-María de longitud 5. Del mismo modo que el paseo Sofía-Hugo-María es Sólo de longitud 2, exactamente el mismo corresponde al paseo de longitud más corta entre ambas. La longitud del sendero más corto entre un par de nodos en una red es una distancia entre declaraciones nodos y se conoce Al idéntico que distancia topológica o distancia del sendero más corto. Supongamos que cada miembro tiene en su lista de contactos de WhatsApp Solo a aquellos integrantes de la red que son sus amigos. Entonces, si un profesor del instituto quisiera dar una información por esta vía a un miembro de la red para que la difundiera lo más rápido posible entre todos sus miembros, ¿a quién le tendría que enviar el wasap? Evidentemente no a Mateo. La razón es que Mateo Solo podría enviar un Whatsapp a dos integrantes (Martina y María), posteriormente María debería enviar un Whatsapp a Hugo y En este sentido sucesivamente hasta que en 4 pasos la información llegara a Martín y a Lucas. Pero tampoco Sofía sería la persona en mejor capacidad de distribuir la datos lo más de forma rápida posible. Cierto que con un Sólo wasap ella alcanzaría a 4 integrantes de la red, No obstante harían falta 3 pasos para alcanzar a Martina y a Mateo. Para determinar el mejor pretendiente a distribuir velozmente la datos calculemos la suma de las distancias que separan a cada miembro de la red del resto. Tomemos a Mateo Tal como ejemplo. Su distancia a Martina y a María es 1, a Hugo es de 2, a Sofía y a Lucía de 3 y a Martín y a Lucas de 4. La suma de todas y cada una ellas nos da 18, que es la lejanía de Mateo al resto de integrantes de la red. Para no herir sentimientos, en el análisis de redes preferimos platicar de la centralidad de cercanía de un nodo en sitio de su lejanía. Ésta se define para un nodo Al idéntico que el recíproco de la lejanía. En la Tabla 1 ilustramos los valores de la centralidad de cercanía de cada nodo en la red. Esta segunda medida de centralidad de los nodos nos indica que el maestro tendría que enviar el primer Whatsapp a Hugo, quien es el nodo más central de pacto con la cercanía en esta red. Así la data alcanzaría a todos los miembros de la red en no más de dos pasos. Si es que calculamos la distancia promedio A partir de Hugo al resto de los integrantes de la red vemos que esta es de Solo 11/7 ≈1,57, al paso que para Mateo y Martina es de 18/7 ≈ 2.57. Por norma general, para toda la red la distancia promedio es relativamente niña, 118/(n (n – 1)) ≈ 2,107, donde el numerador es el monto de las lejanías de todos y cada uno de los nodos y el numerador es el número de pares de nodos, con n siendo en número de nodos en la red. Es decir, Del mismo modo que promedio la datos toma aproximadamente Solo 2 pasos para ir de un nodo a otro. Si analizamos la centralidad de María de pacto con el grado y la cercanía, no percibimos verdaderamente nada particular sobre su posición en la red. Su grado es de 3, idéntico que el de otros tres integrantes de la red, y su cercanía la ubica empatada con Lucía en la tercera/cuarta posición. Si es que bien, la posición de Hugo y María en esta red es vital a fin de que exista comunicación entre las dos clases del colegio. Si es que se rompiera esta relación, ninguna información podría pasar de una clase a otra. Ellos forman el único puente entre ambas clases. Para capturar esta centralidad de los nodos, en el análisis de redes se estudia una medida famosa De este modo tal y como intermediación. Ésta se define para el nodo k Del mismo modo que la suma de las razones P_ikj/P_ij para todos los pares de nodos i y j en la red. Aquí, P_ijk es el número de senderos más cortos entre pares de nodos i y j que pasan por el nodo k. Por su comunicado, P_ij son todos y cada uno de los caminos más cortos entre pares de nodos i y j. Veámoslo en la red. Si es que analizamos a Martín vemos que A lo largo de él pasa Sólo el sendero más corto Lucía-Martín-Lucas. No obstante, entre Lucía y Lucas existe Asimismo el trayecto más corto Lucía-Sofía-Lucas. Por ende, y la intermediación de Martín es 1/2. Las intermediaciones de todos y cada uno de los miembros de la red están en la Tabla 1. O BIEN sea, que María sí que es muy central en la red de pacto con su intermediación, Si bien no tenga un alto grado (número de amigos) y no tenga una cercanía muy grande al resto de miembros. La 1era lección que nos da este sencillo análisis es que Cuando alguna persona se cree un ‘influencer’ por el hecho de que tiene un alto número de contactos (es decir un alto grado), posiblemente esté obviando el papel fundamental que otros juegan en la red A pesar de no disponer goles contactos. Los nodos con alta intermediación juegan un papel muy particular en las redes de infraestructuras (internet, acueductos, redes de transporte) Puesto que ellos sostienen unidas diversos partes de las redes y su desconexión Gracias a errores o bien ataques a estos sistemas están haciendo que la red abandone de funcionar. Un ejemplo reciente ha sido el atasco producido por el ‘Ever Given’ en el Canal de Suez, un nodo de la red de transporte marítimo con alta intermediación. Las conexiones entre los nodos pueden Además ser dirigidas. En la escuela han enseñado a los Estudiantes a crear páginas web personales. Cada página puede hacer referencias a otras páginas de los integrantes del conjunto. No obstante no todas y cada una de las referencias son recíprocas. Por poner un ejemplo, Lucas ha decidido recomendar la página de Sofía, Sin embargo Sofía no recomienda la de Lucas. En este caso habría una conexión liderada Lucas → Sofía, No obstante no Lucas ← Sofía. Si dos miembros se recomiendan mutuamente entonces tenemos, por ejemplo: Lucía ←→ Sofía. Esta red de conexiones entre páginas web de los integrantes del grupo se ilustra ahora. Martín Precisa cuatro clics para llegar a la página de María, Sin embargo jamás podría llegar a las páginas de Martina o bien Mateo pues éstas no tienen ninguna entrada A partir del resto de los integrantes. En la actualidad hay más de 1.700.000.000 páginas web, de las que alrededor de 200 millones están activas. En un Solo análisis realizado acerca de 203.549.046 páginas web se localizaron 2.130.000.000 conexiones dirigidas entre ellas. A ver, estamos diciendo que esta red contiene ¡más de 200 millones de nodos y más de 2 millardos de conexiones! Si entonces seleccionamos 2 nodos al azar, digamos A y B, entre esos 200 millones y pensamos a que distancia están el uno del otro, ¿Qué podríamos pensar? ¿Qué están separados por un millón de conexiones? ¿Por cientos de miles? ¿Por miles? Pensemos en las consecuencias. Si es que comenzáramos navegando en A en una manera completamente aleatoria necesitaríamos millones, o cientos de miles o bien miles de clics para llegar a B. Casi nos moriríamos de aburrimiento Antes de completar esta búsqueda. Todos sabemos que, usemos el navegador que usemos, En general encontramos lo cual Deseamos con unos pocos clics. Por el hecho de que bien, el promedio de las distancias de trayecto más corto en esta red de más de 200 millones de nodos es de Sólo 16. Si, si es que, lo has entendido bien. Si es que seleccionamos dos páginas web al azar en la WWW estarán separadas Tal como promedio por Sólo 16 clics. El diámetro, la máxima separación entre dos nodos, de esta red es de Solo 503, Sin embargo se considera que pudiera llegar a los 905. Es decir, ¡no hay dos páginas web separadas a más de 1000 clics! Esta fascinante propiedad de las redes se conoce Del mismo modo que fenómeno de pequeño planeta. Sucede que, si una red de pequeño mundo tiene n nodos, la distancia de sendero más corto promedio va a ser proporcional al logaritmo de n. Dicho de otro modo, si es que una red tiene del orden de los 100 nodos la separación promedio entre dos nodos va a ser de aproximadamente 4.6. Si es que tuviera 1000 nodos esta separación sería de 6.9, y De esta forma sucesivamente. Aun De esta manera, requerimos alguna brújula para encontrar la aguja que buscamos en el pajar de páginas webs existentes. Expresado de otro modo, si tecleamos ‘ABCdario de las matemáticas’ en un buscador, éste nos hará una lista de páginas web relacionadas a este término. En los primeros puestos encontraremos la página del periódico ABC que contiene nuestra sección. Y lo ha hecho en una fracción de segundo. ¿Cómo lo ha hecho? Por medio de la magia de la centralidad de los nodos de la red. Una de las medidas de centralidad más conocidas para la busca en redes dirigidas Al idéntico que la WWW es PageRank. Este algoritmo se dirigió desarrollado por los autores de Google y convirtió a este buscador en uno de los más populares de cuantos existen en la actualidad. La filosofía de PageRank es que la centralidad de tu página web no depende de a cuantas páginas recomiende, Sino más bien más bien que de cuantas la recomiendan a ella. Más todavía, no Solo depende del número de páginas que la recomienden, Sino más bien más bien de la centralidad de estas páginas. Por ende, Entre tanto más páginas con alto PageRank recomienden tu página, más PageRank va a disponer La misma. PageRank se define Al similar que un proceso iterativo. En otros términos, que elabora los cálculos A partir de una fórmula que se repite De este modo misma hasta que lleguemos a una precisión deseada. Por lo tanto, para calcular el PageRank de la página p_i en la iteración k+1 requerimos los PageRank de todas las páginas p_j que recomiendan a p_i en la precedente iteración: donde d es un parámetro de “teletransportación” que nos deja visitar las páginas de Mateo y Martina, Sin embargo no tengan entradas Desde el resto de los miembros del grupo y Así no quedarnos atascados, n es el número de nodos en la red y L es el número de conexiones que salen de la página correspondiente. Para empezar el proceso inicializamos a todas y cada una de las páginas web con el mismo PageRank, idéntico a (1/n). El proceso sigue hasta alcanzar valores que prácticamente no se diferencien de los precedentes. En la proxima Tabla mostramos los resultados de las dos primeras iteraciones y el resultado definitivo. Del mismo modo que se puede observar las páginas de Sofía y Lucía son las más centrales y aparecerán entre las primeras en las búsquedas sobre su instituto. Para no contar que efectuar este tedioso método iterativo, el Álgebra Lineal ofrece una solución basada en el manipulación de valores y vectores propios de cierta matriz estocástica relacionada a la red. En este caso PageRank en un vector propio de dicha matriz. Este vector propio tuvo un valor de 25.000.000.000 de dólares en la fecha Google salió a bolsa. Pero esa ya es otra historia. Ernesto Estrada es Maestro de investigación del CSIC en el Instituto de Física Interdisciplinar y Sistemas Complejos (IFISC-CSIC-UIB), Campus Universitat de les Illes Balears, en Palma de Mallorca El ABCdario de las Matemáticas es una sección que surge de la colaboración con la Real Sociedad Matemática Española (RSME).