{"id":16106,"date":"2022-05-04T21:20:08","date_gmt":"2022-05-04T20:20:08","guid":{"rendered":"https:\/\/complex-systems-ai.com\/?page_id=16106"},"modified":"2022-05-04T21:50:33","modified_gmt":"2022-05-04T20:50:33","slug":"google-pagerank-et-chaine-de-markov","status":"publish","type":"page","link":"https:\/\/complex-systems-ai.com\/es\/proceso-de-markov\/google-pagerank-y-markov-chain\/","title":{"rendered":"Google PageRank y cadena de Markov"},"content":{"rendered":"<div data-elementor-type=\"wp-page\" data-elementor-id=\"16106\" class=\"elementor elementor-16106\">\n\t\t\t\t\t\t<section class=\"elementor-section elementor-top-section elementor-element elementor-element-daa4af5 elementor-section-boxed elementor-section-height-default elementor-section-height-default\" data-id=\"daa4af5\" data-element_type=\"section\" data-e-type=\"section\">\n\t\t\t\t\t\t<div class=\"elementor-container elementor-column-gap-default\">\n\t\t\t\t\t<div class=\"elementor-column elementor-col-33 elementor-top-column elementor-element elementor-element-7a432a9\" data-id=\"7a432a9\" data-element_type=\"column\" data-e-type=\"column\">\n\t\t\t<div class=\"elementor-widget-wrap elementor-element-populated\">\n\t\t\t\t\t\t<div class=\"elementor-element elementor-element-a4f62ca elementor-align-justify elementor-widget elementor-widget-button\" data-id=\"a4f62ca\" data-element_type=\"widget\" data-e-type=\"widget\" data-widget_type=\"button.default\">\n\t\t\t\t<div class=\"elementor-widget-container\">\n\t\t\t\t\t\t\t\t\t<div class=\"elementor-button-wrapper\">\n\t\t\t\t\t<a class=\"elementor-button elementor-button-link elementor-size-sm\" href=\"https:\/\/complex-systems-ai.com\/es\/proceso-de-markov\/\">\n\t\t\t\t\t\t<span class=\"elementor-button-content-wrapper\">\n\t\t\t\t\t\t\t\t\t<span class=\"elementor-button-text\">Proceso de Markov<\/span>\n\t\t\t\t\t<\/span>\n\t\t\t\t\t<\/a>\n\t\t\t\t<\/div>\n\t\t\t\t\t\t\t\t<\/div>\n\t\t\t\t<\/div>\n\t\t\t\t\t<\/div>\n\t\t<\/div>\n\t\t\t\t<div class=\"elementor-column elementor-col-33 elementor-top-column elementor-element elementor-element-f42f74a\" data-id=\"f42f74a\" data-element_type=\"column\" data-e-type=\"column\">\n\t\t\t<div class=\"elementor-widget-wrap elementor-element-populated\">\n\t\t\t\t\t\t<div class=\"elementor-element elementor-element-01fa57a elementor-align-justify elementor-widget elementor-widget-button\" data-id=\"01fa57a\" data-element_type=\"widget\" data-e-type=\"widget\" data-widget_type=\"button.default\">\n\t\t\t\t<div class=\"elementor-widget-container\">\n\t\t\t\t\t\t\t\t\t<div class=\"elementor-button-wrapper\">\n\t\t\t\t\t<a class=\"elementor-button elementor-button-link elementor-size-sm\" href=\"https:\/\/complex-systems-ai.com\/es\/\">\n\t\t\t\t\t\t<span class=\"elementor-button-content-wrapper\">\n\t\t\t\t\t\t\t\t\t<span class=\"elementor-button-text\">Pagina de inicio<\/span>\n\t\t\t\t\t<\/span>\n\t\t\t\t\t<\/a>\n\t\t\t\t<\/div>\n\t\t\t\t\t\t\t\t<\/div>\n\t\t\t\t<\/div>\n\t\t\t\t\t<\/div>\n\t\t<\/div>\n\t\t\t\t<div class=\"elementor-column elementor-col-33 elementor-top-column elementor-element elementor-element-59aa27a\" data-id=\"59aa27a\" data-element_type=\"column\" data-e-type=\"column\">\n\t\t\t<div class=\"elementor-widget-wrap elementor-element-populated\">\n\t\t\t\t\t\t<div class=\"elementor-element elementor-element-eeda581 elementor-align-justify elementor-widget elementor-widget-button\" data-id=\"eeda581\" data-element_type=\"widget\" data-e-type=\"widget\" data-widget_type=\"button.default\">\n\t\t\t\t<div class=\"elementor-widget-container\">\n\t\t\t\t\t\t\t\t\t<div class=\"elementor-button-wrapper\">\n\t\t\t\t\t<a class=\"elementor-button elementor-button-link elementor-size-sm\" href=\"https:\/\/fr.wikipedia.org\/wiki\/Processus_stochastique\" target=\"_blank\" rel=\"noopener\">\n\t\t\t\t\t\t<span class=\"elementor-button-content-wrapper\">\n\t\t\t\t\t\t\t\t\t<span class=\"elementor-button-text\">Wiki<\/span>\n\t\t\t\t\t<\/span>\n\t\t\t\t\t<\/a>\n\t\t\t\t<\/div>\n\t\t\t\t\t\t\t\t<\/div>\n\t\t\t\t<\/div>\n\t\t\t\t\t<\/div>\n\t\t<\/div>\n\t\t\t\t\t<\/div>\n\t\t<\/section>\n\t\t\t\t<section class=\"elementor-section elementor-top-section elementor-element elementor-element-c1821b2 elementor-section-boxed elementor-section-height-default elementor-section-height-default\" data-id=\"c1821b2\" data-element_type=\"section\" data-e-type=\"section\">\n\t\t\t\t\t\t<div class=\"elementor-container elementor-column-gap-default\">\n\t\t\t\t\t<div class=\"elementor-column elementor-col-100 elementor-top-column elementor-element elementor-element-3f49ee8\" data-id=\"3f49ee8\" data-element_type=\"column\" data-e-type=\"column\">\n\t\t\t<div class=\"elementor-widget-wrap elementor-element-populated\">\n\t\t\t\t\t\t<div class=\"elementor-element elementor-element-c611247 elementor-widget elementor-widget-text-editor\" data-id=\"c611247\" data-element_type=\"widget\" data-e-type=\"widget\" data-widget_type=\"text-editor.default\">\n\t\t\t\t<div class=\"elementor-widget-container\">\n\t\t\t\t\t\t\t\t\t<p>El algoritmo Google PageRank, que es el centro de b\u00fasqueda de Google, se basa en las cadenas de Markov, aqu\u00ed est\u00e1 su explicaci\u00f3n (para la versi\u00f3n b\u00e1sica).<\/p><p><img decoding=\"async\" class=\"aligncenter wp-image-11096 size-full\" src=\"https:\/\/complex-systems-ai.com\/wp-content\/uploads\/2020\/09\/cropped-Capture.png\" alt=\"PageRank de Google\" width=\"97\" height=\"97\" title=\"\"><\/p>\t\t\t\t\t\t\t\t<\/div>\n\t\t\t\t<\/div>\n\t\t\t\t\t<\/div>\n\t\t<\/div>\n\t\t\t\t\t<\/div>\n\t\t<\/section>\n\t\t\t\t<section class=\"elementor-section elementor-top-section elementor-element elementor-element-4d0e114 elementor-section-boxed elementor-section-height-default elementor-section-height-default\" data-id=\"4d0e114\" data-element_type=\"section\" data-e-type=\"section\">\n\t\t\t\t\t\t<div class=\"elementor-container elementor-column-gap-default\">\n\t\t\t\t\t<div class=\"elementor-column elementor-col-100 elementor-top-column elementor-element elementor-element-73dcb81\" data-id=\"73dcb81\" data-element_type=\"column\" data-e-type=\"column\">\n\t\t\t<div class=\"elementor-widget-wrap elementor-element-populated\">\n\t\t\t\t\t\t<div class=\"elementor-element elementor-element-3e1dc40 elementor-widget elementor-widget-heading\" data-id=\"3e1dc40\" data-element_type=\"widget\" data-e-type=\"widget\" data-widget_type=\"heading.default\">\n\t\t\t\t<div class=\"elementor-widget-container\">\n\t\t\t\t\t<div id=\"ez-toc-container\" class=\"ez-toc-v2_0_85 counter-hierarchy ez-toc-counter ez-toc-grey ez-toc-container-direction\">\n<div class=\"ez-toc-title-container\">\n<p class=\"ez-toc-title\" style=\"cursor:inherit\">Contenido<\/p>\n<span class=\"ez-toc-title-toggle\"><a href=\"#\" class=\"ez-toc-pull-right ez-toc-btn ez-toc-btn-xs ez-toc-btn-default ez-toc-toggle\" aria-label=\"Tabla de contenido alternativo\"><span class=\"ez-toc-js-icon-con\"><span class=\"\"><span class=\"eztoc-hide\" style=\"display:none;\">Palanca<\/span><span class=\"ez-toc-icon-toggle-span\"><svg style=\"fill: #999;color:#999\" xmlns=\"http:\/\/www.w3.org\/2000\/svg\" class=\"list-377408\" width=\"20px\" height=\"20px\" viewbox=\"0 0 24 24\" fill=\"none\"><path d=\"M6 6H4v2h2V6zm14 0H8v2h12V6zM4 11h2v2H4v-2zm16 0H8v2h12v-2zM4 16h2v2H4v-2zm16 0H8v2h12v-2z\" fill=\"currentColor\"><\/path><\/svg><svg style=\"fill: #999;color:#999\" class=\"arrow-unsorted-368013\" xmlns=\"http:\/\/www.w3.org\/2000\/svg\" width=\"10px\" height=\"10px\" viewbox=\"0 0 24 24\" version=\"1.2\" baseprofile=\"tiny\"><path d=\"M18.2 9.3l-6.2-6.3-6.2 6.3c-.2.2-.3.4-.3.7s.1.5.3.7c.2.2.4.3.7.3h11c.3 0 .5-.1.7-.3.2-.2.3-.5.3-.7s-.1-.5-.3-.7zM5.8 14.7l6.2 6.3 6.2-6.3c.2-.2.3-.5.3-.7s-.1-.5-.3-.7c-.2-.2-.4-.3-.7-.3h-11c-.3 0-.5.1-.7.3-.2.2-.3.5-.3.7s.1.5.3.7z\"\/><\/svg><\/span><\/span><\/span><\/a><\/span><\/div>\n<nav><ul class='ez-toc-list ez-toc-list-level-1' ><li class='ez-toc-page-1 ez-toc-heading-level-2'><a class=\"ez-toc-link ez-toc-heading-1\" href=\"https:\/\/complex-systems-ai.com\/es\/proceso-de-markov\/google-pagerank-y-markov-chain\/#La-naissance-de-Google-PageRank\" >El nacimiento de Google PageRank<\/a><\/li><li class='ez-toc-page-1 ez-toc-heading-level-2'><a class=\"ez-toc-link ez-toc-heading-2\" href=\"https:\/\/complex-systems-ai.com\/es\/proceso-de-markov\/google-pagerank-y-markov-chain\/#Exemple\" >Ejemplo<\/a><\/li><li class='ez-toc-page-1 ez-toc-heading-level-2'><a class=\"ez-toc-link ez-toc-heading-3\" href=\"https:\/\/complex-systems-ai.com\/es\/proceso-de-markov\/google-pagerank-y-markov-chain\/#Casser-le-systeme\" >romper el sistema<\/a><\/li><\/ul><\/nav><\/div>\n<h2 class=\"elementor-heading-title elementor-size-default\"><span class=\"ez-toc-section\" id=\"La-naissance-de-Google-PageRank\"><\/span>El nacimiento de Google PageRank<span class=\"ez-toc-section-end\"><\/span><\/h2>\t\t\t\t<\/div>\n\t\t\t\t<\/div>\n\t\t\t\t\t<\/div>\n\t\t<\/div>\n\t\t\t\t\t<\/div>\n\t\t<\/section>\n\t\t\t\t<section class=\"elementor-section elementor-top-section elementor-element elementor-element-7d4386b elementor-section-boxed elementor-section-height-default elementor-section-height-default\" data-id=\"7d4386b\" data-element_type=\"section\" data-e-type=\"section\">\n\t\t\t\t\t\t<div class=\"elementor-container elementor-column-gap-default\">\n\t\t\t\t\t<div class=\"elementor-column elementor-col-100 elementor-top-column elementor-element elementor-element-6ce5101\" data-id=\"6ce5101\" data-element_type=\"column\" data-e-type=\"column\">\n\t\t\t<div class=\"elementor-widget-wrap elementor-element-populated\">\n\t\t\t\t\t\t<div class=\"elementor-element elementor-element-4055d2a elementor-widget elementor-widget-text-editor\" data-id=\"4055d2a\" data-element_type=\"widget\" data-e-type=\"widget\" data-widget_type=\"text-editor.default\">\n\t\t\t\t<div class=\"elementor-widget-container\">\n\t\t\t\t\t\t\t\t\t<p>Con mil millones de sitios en Internet, es imposible analizar su contenido. Sin embargo, Internet no es una colecci\u00f3n de textos independientes sino un inmenso hipertexto: las p\u00e1ginas se citan entre s\u00ed. Considerar la web como un <a href=\"https:\/\/complex-systems-ai.com\/es\/teoria-de-grafos\/\">grafico<\/a> y teniendo en cuenta los enlaces entre las p\u00e1ginas, podemos hacer cosas interesantes. Los primeros que abordaron este punto de vista fueron Larry Page y Sergey Brin, fundadores de Google, con su <a href=\"https:\/\/complex-systems-ai.com\/es\/algoritmico\/\">algoritmo<\/a> Rango de p\u00e1gina.<\/p><p>Desde su concepci\u00f3n en 1998, Google ha dominado el mercado de los motores de b\u00fasqueda en Internet. 17 a\u00f1os despu\u00e9s, sus t\u00e9cnicas ya han evolucionado mucho, los resultados de b\u00fasqueda son cada vez m\u00e1s relevantes, pero la idea principal sigue estando basada en el algoritmo para clasificar PageRank. En este art\u00edculo, veremos m\u00e1s de cerca este algoritmo y el v\u00ednculo con la cadena de Markov. <a href=\"https:\/\/complex-systems-ai.com\/es\/proceso-de-markov\/cadenas-de-markov-en-tiempo-discreto\/\">cadena de markov<\/a>.<\/p><p>PageRank utiliza una funci\u00f3n que asigna un valor a cada p\u00e1gina en Internet. Cuanto mayor sea el valor, m\u00e1s importante ser\u00e1 la p\u00e1gina.<\/p><p>PageRank es un algoritmo que es independiente de la consulta y el contenido. La independencia de la consulta significa que la clasificaci\u00f3n de los sitios se realiza fuera de l\u00ednea. De hecho, cada 30 d\u00edas, Google descarga, indexa y clasifica todos los sitios. Por lo tanto, la clasificaci\u00f3n de los resultados no depende de la consulta. La independencia del contenido es bastante clara ya que se comenta en la parte de Introducci\u00f3n: el algoritmo PageRank no utiliza los contenidos sino los enlaces para clasificar las p\u00e1ginas.<\/p><p>La mayor\u00eda de ellos clasifican los resultados seg\u00fan la frecuencia con la que se usa la palabra de b\u00fasqueda en cada sitio. Esto r\u00e1pidamente revel\u00f3 problemas: si un sitio quiere atraer visitantes, solo tiene que enviar spam a las palabras clave y el motor de b\u00fasqueda creer\u00e1 que es un resultado realmente relevante.<\/p><p>Las t\u00e9cnicas para enga\u00f1ar a los motores de b\u00fasqueda como este se denominan &quot;spam de t\u00e9rminos&quot;. Para evitar estos fraudes, Larry Page y Sergey Brin crearon PageRank con 2 innovaciones:<\/p><p>\u2014 PageRank simula una caminata aleatoria de un visitante, que elige aleatoriamente un enlace en la p\u00e1gina actual para pasar a la p\u00e1gina siguiente. Este proceso se repite varias veces y los autores razonan que las p\u00e1ginas en las que el usuario pasa m\u00e1s tiempo son m\u00e1s importantes que aquellas que el usuario rara vez visita.<\/p><p>\u2014 La importancia de una p\u00e1gina depende de la importancia de las p\u00e1ginas que <br \/>llevar a esto. Entonces, incluso si alguien ha creado 1000 p\u00e1ginas falsas que contienen enlaces a la p\u00e1gina principal, el PageRank de esa p\u00e1gina principal no mejora mucho porque esas 1000 p\u00e1ginas falsas no son &quot;importantes&quot;.<\/p><p>En este momento, Page y Brin a\u00fan no han abordado el t\u00e9rmino &quot;Markov&quot; en su art\u00edculo, pero uno puede notar f\u00e1cilmente que el modelo de la caminata aleatoria es una cadena de Markov. A\u00fan m\u00e1s interesante, la probabilidad estacionaria de una cadena de Markov nos da una idea de la proporci\u00f3n de tiempo que pasar\u00e1 Xn en cada estado a largo plazo.<\/p><p>Entonces, si la cadena converge hacia su probabilidad estacionaria, su probabilidad l\u00edmite es de hecho el PageRank buscado. En otras palabras, el algoritmo PageRank calcula el rango de cada sitio al encontrar la probabilidad estacionaria \u00fanica de la cadena de Markov.<\/p><p>Pero la vida no es tan simple. No podemos asegurar que nuestra cadena de Markov converja, o que haya una \u00fanica probabilidad estacionaria. Este suele ser el caso de un modelo de Internet. Por ejemplo, es muy poco probable que los sitios de Matem\u00e1ticas tengan enlaces a sitios de Deportes (s\u00ed, porque los geeks no practican deportes...), por lo que nuestra cadena de Markov tiene 2 clases finales, por lo tanto, 2 probabilidades estacionarias.<\/p><p>Para resolver este problema, Page y Brin intentan construir una cadena de Markov <a href=\"https:\/\/complex-systems-ai.com\/es\/proceso-de-markov\/ley-invariante-y-comportamiento-asintotico\/\">erg\u00f3dico<\/a>, lo que asegurar\u00e1 la existencia de una probabilidad estacionaria \u00fanica, que se convierte en el vector PageRank.<\/p>\t\t\t\t\t\t\t\t<\/div>\n\t\t\t\t<\/div>\n\t\t\t\t\t<\/div>\n\t\t<\/div>\n\t\t\t\t\t<\/div>\n\t\t<\/section>\n\t\t\t\t<section class=\"elementor-section elementor-top-section elementor-element elementor-element-0381270 elementor-section-boxed elementor-section-height-default elementor-section-height-default\" data-id=\"0381270\" data-element_type=\"section\" data-e-type=\"section\">\n\t\t\t\t\t\t<div class=\"elementor-container elementor-column-gap-default\">\n\t\t\t\t\t<div class=\"elementor-column elementor-col-100 elementor-top-column elementor-element elementor-element-bfe3755\" data-id=\"bfe3755\" data-element_type=\"column\" data-e-type=\"column\">\n\t\t\t<div class=\"elementor-widget-wrap elementor-element-populated\">\n\t\t\t\t\t\t<div class=\"elementor-element elementor-element-7c7e318 elementor-widget elementor-widget-heading\" data-id=\"7c7e318\" data-element_type=\"widget\" data-e-type=\"widget\" data-widget_type=\"heading.default\">\n\t\t\t\t<div class=\"elementor-widget-container\">\n\t\t\t\t\t<h2 class=\"elementor-heading-title elementor-size-default\"><span class=\"ez-toc-section\" id=\"Exemple\"><\/span>Ejemplo<span class=\"ez-toc-section-end\"><\/span><\/h2>\t\t\t\t<\/div>\n\t\t\t\t<\/div>\n\t\t\t\t\t<\/div>\n\t\t<\/div>\n\t\t\t\t\t<\/div>\n\t\t<\/section>\n\t\t\t\t<section class=\"elementor-section elementor-top-section elementor-element elementor-element-35d2862 elementor-section-boxed elementor-section-height-default elementor-section-height-default\" data-id=\"35d2862\" data-element_type=\"section\" data-e-type=\"section\">\n\t\t\t\t\t\t<div class=\"elementor-container elementor-column-gap-default\">\n\t\t\t\t\t<div class=\"elementor-column elementor-col-100 elementor-top-column elementor-element elementor-element-25bbe09\" data-id=\"25bbe09\" data-element_type=\"column\" data-e-type=\"column\">\n\t\t\t<div class=\"elementor-widget-wrap elementor-element-populated\">\n\t\t\t\t\t\t<div class=\"elementor-element elementor-element-7fe5c4d elementor-widget elementor-widget-text-editor\" data-id=\"7fe5c4d\" data-element_type=\"widget\" data-e-type=\"widget\" data-widget_type=\"text-editor.default\">\n\t\t\t\t<div class=\"elementor-widget-container\">\n\t\t\t\t\t\t\t\t\t<p>Sea Xn la p\u00e1gina que visita el usuario en el paso n. Xn se puede modelar mediante una cadena de Markov porque la elecci\u00f3n del usuario depende \u00fanicamente de la p\u00e1gina actual.<\/p><p>Suponiendo que nuestro &quot;Internet&quot; se compone de 7 p\u00e1ginas, que se representan como los 7 nodos. Los bordes representan enlaces entre p\u00e1ginas. Estando en una p\u00e1gina, un visitante elige aleatoriamente un enlace para ir a otra p\u00e1gina, por lo que las probabilidades de ir de una p\u00e1gina a otra son iguales.<\/p><p><img fetchpriority=\"high\" decoding=\"async\" class=\"aligncenter size-medium wp-image-16112\" src=\"https:\/\/complex-systems-ai.com\/wp-content\/uploads\/2022\/05\/Capture-decran-2022-05-04-223357-300x255.png\" alt=\"\" width=\"300\" height=\"255\" title=\"\" srcset=\"https:\/\/complex-systems-ai.com\/wp-content\/uploads\/2022\/05\/Capture-decran-2022-05-04-223357-300x255.png 300w, https:\/\/complex-systems-ai.com\/wp-content\/uploads\/2022\/05\/Capture-decran-2022-05-04-223357-14x12.png 14w, https:\/\/complex-systems-ai.com\/wp-content\/uploads\/2022\/05\/Capture-decran-2022-05-04-223357.png 399w\" sizes=\"(max-width: 300px) 100vw, 300px\" \/><\/p><p>La matriz de transici\u00f3n es:<\/p><p><img decoding=\"async\" class=\"aligncenter size-full wp-image-16113\" src=\"https:\/\/complex-systems-ai.com\/wp-content\/uploads\/2022\/05\/Capture-decran-2022-05-04-223528.png\" alt=\"\" width=\"206\" height=\"190\" title=\"\" srcset=\"https:\/\/complex-systems-ai.com\/wp-content\/uploads\/2022\/05\/Capture-decran-2022-05-04-223528.png 206w, https:\/\/complex-systems-ai.com\/wp-content\/uploads\/2022\/05\/Capture-decran-2022-05-04-223528-13x12.png 13w\" sizes=\"(max-width: 206px) 100vw, 206px\" \/><\/p><p>Observamos que hay 2 estados absorbentes: 4 y 7. La cadena no es erg\u00f3dica, tiene 2 probabilidades estacionarias y por lo tanto no converge hacia una \u00fanica probabilidad.<\/p><p>Para evitar esta situaci\u00f3n, Page y Brin hicieron una suposici\u00f3n:<\/p><p>Una vez que el visitante llega a una p\u00e1gina &quot;final&quot; (es decir, sin enlace para salir), ir\u00e1 a la barra de direcciones y escribir\u00e1 la direcci\u00f3n de un sitio aleatorio.<\/p><p>En t\u00e9rminos de matriz de transici\u00f3n, reemplazaremos la columna del estado absorbente por el vector:<\/p><p><img loading=\"lazy\" decoding=\"async\" class=\"aligncenter size-full wp-image-16114\" src=\"https:\/\/complex-systems-ai.com\/wp-content\/uploads\/2022\/05\/Capture-decran-2022-05-04-223814.png\" alt=\"\" width=\"49\" height=\"115\" title=\"\" srcset=\"https:\/\/complex-systems-ai.com\/wp-content\/uploads\/2022\/05\/Capture-decran-2022-05-04-223814.png 49w, https:\/\/complex-systems-ai.com\/wp-content\/uploads\/2022\/05\/Capture-decran-2022-05-04-223814-5x12.png 5w\" sizes=\"(max-width: 49px) 100vw, 49px\" \/><\/p><p>Por lo tanto, la matriz de transici\u00f3n T se convierte en:<\/p><p><img loading=\"lazy\" decoding=\"async\" class=\"aligncenter size-full wp-image-16115\" src=\"https:\/\/complex-systems-ai.com\/wp-content\/uploads\/2022\/05\/Capture-decran-2022-05-04-223846.png\" alt=\"\" width=\"194\" height=\"191\" title=\"\" srcset=\"https:\/\/complex-systems-ai.com\/wp-content\/uploads\/2022\/05\/Capture-decran-2022-05-04-223846.png 194w, https:\/\/complex-systems-ai.com\/wp-content\/uploads\/2022\/05\/Capture-decran-2022-05-04-223846-12x12.png 12w\" sizes=\"(max-width: 194px) 100vw, 194px\" \/><\/p><p>Con este cambio, T es irreducible y aperi\u00f3dico, por lo tanto, erg\u00f3dico. Sin embargo, esto no siempre es as\u00ed, tomando el ejemplo con sitios de Matem\u00e1ticas y sitios de Deportes, podemos obtener una matriz de transici\u00f3n T:<\/p><p><img loading=\"lazy\" decoding=\"async\" class=\"aligncenter size-full wp-image-16116\" src=\"https:\/\/complex-systems-ai.com\/wp-content\/uploads\/2022\/05\/Capture-decran-2022-05-04-224058.png\" alt=\"\" width=\"203\" height=\"191\" title=\"\" srcset=\"https:\/\/complex-systems-ai.com\/wp-content\/uploads\/2022\/05\/Capture-decran-2022-05-04-224058.png 203w, https:\/\/complex-systems-ai.com\/wp-content\/uploads\/2022\/05\/Capture-decran-2022-05-04-224058-13x12.png 13w\" sizes=\"(max-width: 203px) 100vw, 203px\" \/><\/p><p>No tiene estados absorbentes pero no es irreductible y por lo tanto no erg\u00f3dico. Tenemos que hacer otra suposici\u00f3n:<\/p><p>Suponiendo que el visitante est\u00e1 en una p\u00e1gina, decimos que con probabilidad p elegir\u00e1 uno de los enlaces de esa p\u00e1gina y con probabilidad 1 \u2212 p ir\u00e1 a la barra de direcciones y escribir\u00e1 la direcci\u00f3n de un sitio web al azar.<\/p><p>La nueva matriz de transici\u00f3n es por tanto:<\/p><p>G = pT + (p \u2212 1)K<\/p><p>con K la matriz de la cual cada columna es el vector:<\/p><p><img loading=\"lazy\" decoding=\"async\" class=\"aligncenter size-full wp-image-16114\" src=\"https:\/\/complex-systems-ai.com\/wp-content\/uploads\/2022\/05\/Capture-decran-2022-05-04-223814.png\" alt=\"\" width=\"49\" height=\"115\" title=\"\" srcset=\"https:\/\/complex-systems-ai.com\/wp-content\/uploads\/2022\/05\/Capture-decran-2022-05-04-223814.png 49w, https:\/\/complex-systems-ai.com\/wp-content\/uploads\/2022\/05\/Capture-decran-2022-05-04-223814-5x12.png 5w\" sizes=\"(max-width: 49px) 100vw, 49px\" \/><\/p><p>La matriz G se llama matriz de Google. G es erg\u00f3dica. Google suele utilizar p = 0,85.<\/p><p>Aplicando a nuestro ejemplo, obtenemos:<\/p><p><img loading=\"lazy\" decoding=\"async\" class=\"aligncenter wp-image-16117 size-full\" src=\"https:\/\/complex-systems-ai.com\/wp-content\/uploads\/2022\/05\/Capture-decran-2022-05-04-224509.png\" alt=\"\" width=\"490\" height=\"410\" title=\"\" srcset=\"https:\/\/complex-systems-ai.com\/wp-content\/uploads\/2022\/05\/Capture-decran-2022-05-04-224509.png 490w, https:\/\/complex-systems-ai.com\/wp-content\/uploads\/2022\/05\/Capture-decran-2022-05-04-224509-300x251.png 300w, https:\/\/complex-systems-ai.com\/wp-content\/uploads\/2022\/05\/Capture-decran-2022-05-04-224509-14x12.png 14w\" sizes=\"(max-width: 490px) 100vw, 490px\" \/><\/p><p>Resolviendo G\u03c0 = \u03c0, encontramos:<\/p><p><img loading=\"lazy\" decoding=\"async\" class=\"aligncenter size-full wp-image-16118\" src=\"https:\/\/complex-systems-ai.com\/wp-content\/uploads\/2022\/05\/Capture-decran-2022-05-04-224601.png\" alt=\"\" width=\"109\" height=\"198\" title=\"\" srcset=\"https:\/\/complex-systems-ai.com\/wp-content\/uploads\/2022\/05\/Capture-decran-2022-05-04-224601.png 109w, https:\/\/complex-systems-ai.com\/wp-content\/uploads\/2022\/05\/Capture-decran-2022-05-04-224601-7x12.png 7w\" sizes=\"(max-width: 109px) 100vw, 109px\" \/><\/p><p>Por lo tanto, el orden de clasificaci\u00f3n en nuestro ejemplo es: 3,2,6,5,1,4,7. Entonces, si una palabra buscada aparece en las p\u00e1ginas 1,2,5, el orden de los resultados es 2,5,1.<\/p>\t\t\t\t\t\t\t\t<\/div>\n\t\t\t\t<\/div>\n\t\t\t\t\t<\/div>\n\t\t<\/div>\n\t\t\t\t\t<\/div>\n\t\t<\/section>\n\t\t\t\t<section class=\"elementor-section elementor-top-section elementor-element elementor-element-731929f elementor-section-boxed elementor-section-height-default elementor-section-height-default\" data-id=\"731929f\" data-element_type=\"section\" data-e-type=\"section\">\n\t\t\t\t\t\t<div class=\"elementor-container elementor-column-gap-default\">\n\t\t\t\t\t<div class=\"elementor-column elementor-col-100 elementor-top-column elementor-element elementor-element-ba4f930\" data-id=\"ba4f930\" data-element_type=\"column\" data-e-type=\"column\">\n\t\t\t<div class=\"elementor-widget-wrap elementor-element-populated\">\n\t\t\t\t\t\t<div class=\"elementor-element elementor-element-ea3ad84 elementor-widget elementor-widget-heading\" data-id=\"ea3ad84\" data-element_type=\"widget\" data-e-type=\"widget\" data-widget_type=\"heading.default\">\n\t\t\t\t<div class=\"elementor-widget-container\">\n\t\t\t\t\t<h2 class=\"elementor-heading-title elementor-size-default\"><span class=\"ez-toc-section\" id=\"Casser-le-systeme\"><\/span>romper el sistema<span class=\"ez-toc-section-end\"><\/span><\/h2>\t\t\t\t<\/div>\n\t\t\t\t<\/div>\n\t\t\t\t\t<\/div>\n\t\t<\/div>\n\t\t\t\t\t<\/div>\n\t\t<\/section>\n\t\t\t\t<section class=\"elementor-section elementor-top-section elementor-element elementor-element-cab6840 elementor-section-boxed elementor-section-height-default elementor-section-height-default\" data-id=\"cab6840\" data-element_type=\"section\" data-e-type=\"section\">\n\t\t\t\t\t\t<div class=\"elementor-container elementor-column-gap-default\">\n\t\t\t\t\t<div class=\"elementor-column elementor-col-100 elementor-top-column elementor-element elementor-element-2e17f98\" data-id=\"2e17f98\" data-element_type=\"column\" data-e-type=\"column\">\n\t\t\t<div class=\"elementor-widget-wrap elementor-element-populated\">\n\t\t\t\t\t\t<div class=\"elementor-element elementor-element-201bf58 elementor-widget elementor-widget-text-editor\" data-id=\"201bf58\" data-element_type=\"widget\" data-e-type=\"widget\" data-widget_type=\"text-editor.default\">\n\t\t\t\t<div class=\"elementor-widget-container\">\n\t\t\t\t\t\t\t\t\t<p>Si el valor de PageRank (que tambi\u00e9n es la probabilidad estacionaria) de una p\u00e1gina es p, el tiempo de retorno de esta p\u00e1gina es 1\/p. Entonces podemos aumentar efectivamente el valor de PageRank al reducir el tiempo de retorno, lo cual es posible si creamos ciclos muy cortos, o idealmente bucles.<\/p><p>Concretamente, para una p\u00e1gina x, eliminamos todos los enlaces en ella (es decir, sin salida), creamos otra p\u00e1gina, y, con solo 2 bordes x \u2192 y e y \u2192 x. El valor de PageRank de la p\u00e1gina x aumenta porque cada vez que el visitante se encuentra con esta p\u00e1gina, no puede salir. Como comentamos en la parte 3 (con el ejemplo de Matem\u00e1ticas y Deportes), el algoritmo PageRank puede evitar el efecto de esta estrategia aumentando el valor de p, la probabilidad de que el visitante vaya a la barra de direcci\u00f3n d y escriba la direcci\u00f3n de un sitio al azar.<\/p><p>Otra estrategia es crear muchas p\u00e1ginas que solo tengan 1 borde para la p\u00e1gina x. Esta t\u00e9cnica aprovecha la probabilidad p de reiniciar la caminata. Si tenemos un n\u00famero muy elevado de p\u00e1ginas falsas, es muy probable que al volver a empezar nos encontremos con la p\u00e1gina x, y por tanto aumente el valor del PageRank. Para evitar esta situaci\u00f3n, es necesario disminuir el valor de p.<\/p><p>Gracias a estas 2 situaciones, podemos ver claramente que la elecci\u00f3n de la p es sumamente importante para evitar el spam. Si p es demasiado alto, los spammers solo tienen que crear millones de p\u00e1ginas falsas que conduzcan a sus p\u00e1ginas principales. Por otro lado, con una p muy peque\u00f1a, pueden establecer bucles con sus p\u00e1ginas.<\/p><p>Lo que hemos discutido es solo los conceptos b\u00e1sicos del motor de b\u00fasqueda de Google. Las t\u00e9cnicas ya han evolucionado mucho para dar los resultados m\u00e1s relevantes. La cuesti\u00f3n de la computaci\u00f3n tambi\u00e9n es muy interesante. Dado que la verdadera matriz de Google tiene un tama\u00f1o de 8 mil millones x 8 mil millones, el m\u00e9todo de eliminaci\u00f3n de Gauss no es pr\u00e1ctico. Se utilizan algoritmos m\u00e1s potentes para encontrar los vectores propios, en particular el m\u00e9todo de la potencia.<\/p>\t\t\t\t\t\t\t\t<\/div>\n\t\t\t\t<\/div>\n\t\t\t\t\t<\/div>\n\t\t<\/div>\n\t\t\t\t\t<\/div>\n\t\t<\/section>\n\t\t\t\t<\/div>","protected":false},"excerpt":{"rendered":"<p>P\u00e1gina de inicio de Wiki Proceso de Markov El algoritmo de Google PageRank, que es el centro de b\u00fasqueda de Google, se basa en las cadenas de Markov, \u2026 <\/p>","protected":false},"author":1,"featured_media":0,"parent":5007,"menu_order":0,"comment_status":"closed","ping_status":"closed","template":"","meta":{"footnotes":""},"class_list":["post-16106","page","type-page","status-publish","hentry"],"amp_enabled":true,"_links":{"self":[{"href":"https:\/\/complex-systems-ai.com\/es\/wp-json\/wp\/v2\/pages\/16106","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/complex-systems-ai.com\/es\/wp-json\/wp\/v2\/pages"}],"about":[{"href":"https:\/\/complex-systems-ai.com\/es\/wp-json\/wp\/v2\/types\/page"}],"author":[{"embeddable":true,"href":"https:\/\/complex-systems-ai.com\/es\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/complex-systems-ai.com\/es\/wp-json\/wp\/v2\/comments?post=16106"}],"version-history":[{"count":3,"href":"https:\/\/complex-systems-ai.com\/es\/wp-json\/wp\/v2\/pages\/16106\/revisions"}],"predecessor-version":[{"id":16121,"href":"https:\/\/complex-systems-ai.com\/es\/wp-json\/wp\/v2\/pages\/16106\/revisions\/16121"}],"up":[{"embeddable":true,"href":"https:\/\/complex-systems-ai.com\/es\/wp-json\/wp\/v2\/pages\/5007"}],"wp:attachment":[{"href":"https:\/\/complex-systems-ai.com\/es\/wp-json\/wp\/v2\/media?parent=16106"}],"curies":[{"name":"gracias","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}