{"id":15816,"date":"2022-04-23T20:59:38","date_gmt":"2022-04-23T19:59:38","guid":{"rendered":"https:\/\/complex-systems-ai.com\/?page_id=15816"},"modified":"2022-04-23T21:26:01","modified_gmt":"2022-04-23T20:26:01","slug":"normaliser-standardiser-redimensionner-vos-donnees","status":"publish","type":"page","link":"https:\/\/complex-systems-ai.com\/es\/analisis-de-datos\/normalizar-estandarizar-redimensionar-tus-datos\/","title":{"rendered":"Normalizar Estandarizar Cambiar el tama\u00f1o de sus datos"},"content":{"rendered":"<div data-elementor-type=\"wp-page\" data-elementor-id=\"15816\" class=\"elementor elementor-15816\">\n\t\t\t\t\t\t<section class=\"elementor-section elementor-top-section elementor-element elementor-element-ce3ccf6 elementor-section-boxed elementor-section-height-default elementor-section-height-default\" data-id=\"ce3ccf6\" data-element_type=\"section\" data-e-type=\"section\">\n\t\t\t\t\t\t<div class=\"elementor-container elementor-column-gap-default\">\n\t\t\t\t\t<div class=\"elementor-column elementor-col-33 elementor-top-column elementor-element elementor-element-c4fdaf2\" data-id=\"c4fdaf2\" data-element_type=\"column\" data-e-type=\"column\">\n\t\t\t<div class=\"elementor-widget-wrap elementor-element-populated\">\n\t\t\t\t\t\t<div class=\"elementor-element elementor-element-21ca9fe elementor-align-justify elementor-widget elementor-widget-button\" data-id=\"21ca9fe\" data-element_type=\"widget\" data-e-type=\"widget\" data-widget_type=\"button.default\">\n\t\t\t\t<div class=\"elementor-widget-container\">\n\t\t\t\t\t\t\t\t\t<div class=\"elementor-button-wrapper\">\n\t\t\t\t\t<a class=\"elementor-button elementor-button-link elementor-size-sm\" href=\"https:\/\/complex-systems-ai.com\/es\/analisis-de-datos\/\">\n\t\t\t\t\t\t<span class=\"elementor-button-content-wrapper\">\n\t\t\t\t\t\t\t\t\t<span class=\"elementor-button-text\">An\u00e1lisis de datos<\/span>\n\t\t\t\t\t<\/span>\n\t\t\t\t\t<\/a>\n\t\t\t\t<\/div>\n\t\t\t\t\t\t\t\t<\/div>\n\t\t\t\t<\/div>\n\t\t\t\t\t<\/div>\n\t\t<\/div>\n\t\t\t\t<div class=\"elementor-column elementor-col-33 elementor-top-column elementor-element elementor-element-4516e69\" data-id=\"4516e69\" data-element_type=\"column\" data-e-type=\"column\">\n\t\t\t<div class=\"elementor-widget-wrap elementor-element-populated\">\n\t\t\t\t\t\t<div class=\"elementor-element elementor-element-c473152 elementor-align-justify elementor-widget elementor-widget-button\" data-id=\"c473152\" data-element_type=\"widget\" data-e-type=\"widget\" data-widget_type=\"button.default\">\n\t\t\t\t<div class=\"elementor-widget-container\">\n\t\t\t\t\t\t\t\t\t<div class=\"elementor-button-wrapper\">\n\t\t\t\t\t<a class=\"elementor-button elementor-button-link elementor-size-sm\" href=\"https:\/\/complex-systems-ai.com\/es\/\">\n\t\t\t\t\t\t<span class=\"elementor-button-content-wrapper\">\n\t\t\t\t\t\t\t\t\t<span class=\"elementor-button-text\">Pagina de inicio<\/span>\n\t\t\t\t\t<\/span>\n\t\t\t\t\t<\/a>\n\t\t\t\t<\/div>\n\t\t\t\t\t\t\t\t<\/div>\n\t\t\t\t<\/div>\n\t\t\t\t\t<\/div>\n\t\t<\/div>\n\t\t\t\t<div class=\"elementor-column elementor-col-33 elementor-top-column elementor-element elementor-element-2804615\" data-id=\"2804615\" data-element_type=\"column\" data-e-type=\"column\">\n\t\t\t<div class=\"elementor-widget-wrap elementor-element-populated\">\n\t\t\t\t\t\t<div class=\"elementor-element elementor-element-bee4801 elementor-align-justify elementor-widget elementor-widget-button\" data-id=\"bee4801\" data-element_type=\"widget\" data-e-type=\"widget\" data-widget_type=\"button.default\">\n\t\t\t\t<div class=\"elementor-widget-container\">\n\t\t\t\t\t\t\t\t\t<div class=\"elementor-button-wrapper\">\n\t\t\t\t\t<a class=\"elementor-button elementor-button-link elementor-size-sm\" href=\"https:\/\/en.wikipedia.org\/wiki\/Data_analysis\" target=\"_blank\" rel=\"noopener\">\n\t\t\t\t\t\t<span class=\"elementor-button-content-wrapper\">\n\t\t\t\t\t\t\t\t\t<span class=\"elementor-button-text\">Wiki<\/span>\n\t\t\t\t\t<\/span>\n\t\t\t\t\t<\/a>\n\t\t\t\t<\/div>\n\t\t\t\t\t\t\t\t<\/div>\n\t\t\t\t<\/div>\n\t\t\t\t\t<\/div>\n\t\t<\/div>\n\t\t\t\t\t<\/div>\n\t\t<\/section>\n\t\t\t\t<section class=\"elementor-section elementor-top-section elementor-element elementor-element-4abebeb elementor-section-boxed elementor-section-height-default elementor-section-height-default\" data-id=\"4abebeb\" data-element_type=\"section\" data-e-type=\"section\">\n\t\t\t\t\t\t<div class=\"elementor-container elementor-column-gap-default\">\n\t\t\t\t\t<div class=\"elementor-column elementor-col-100 elementor-top-column elementor-element elementor-element-8e7316d\" data-id=\"8e7316d\" data-element_type=\"column\" data-e-type=\"column\">\n\t\t\t<div class=\"elementor-widget-wrap elementor-element-populated\">\n\t\t\t\t\t\t<div class=\"elementor-element elementor-element-5ccc0d3 elementor-widget elementor-widget-text-editor\" data-id=\"5ccc0d3\" data-element_type=\"widget\" data-e-type=\"widget\" data-widget_type=\"text-editor.default\">\n\t\t\t\t<div class=\"elementor-widget-container\">\n\t\t\t\t\t\t\t\t\t<p>Para poder analizar sus datos y realizar cualquier preprocesamiento o reducci\u00f3n, es muy importante normalizar, estandarizar y redimensionar correctamente sus datos. Aqu\u00ed est\u00e1n los tutoriales.<\/p><p><img decoding=\"async\" class=\"aligncenter wp-image-11096 size-full\" src=\"https:\/\/complex-systems-ai.com\/wp-content\/uploads\/2020\/09\/cropped-Capture.png\" alt=\"normalizar estandarizar cambiar el tama\u00f1o de sus datos\" width=\"97\" height=\"97\" title=\"\"><\/p>\t\t\t\t\t\t\t\t<\/div>\n\t\t\t\t<\/div>\n\t\t\t\t\t<\/div>\n\t\t<\/div>\n\t\t\t\t\t<\/div>\n\t\t<\/section>\n\t\t\t\t<section class=\"elementor-section elementor-top-section elementor-element elementor-element-1b65b9f elementor-section-boxed elementor-section-height-default elementor-section-height-default\" data-id=\"1b65b9f\" data-element_type=\"section\" data-e-type=\"section\">\n\t\t\t\t\t\t<div class=\"elementor-container elementor-column-gap-default\">\n\t\t\t\t\t<div class=\"elementor-column elementor-col-100 elementor-top-column elementor-element elementor-element-05d23e7\" data-id=\"05d23e7\" data-element_type=\"column\" data-e-type=\"column\">\n\t\t\t<div class=\"elementor-widget-wrap elementor-element-populated\">\n\t\t\t\t\t\t<div class=\"elementor-element elementor-element-324d4e5 elementor-widget elementor-widget-heading\" data-id=\"324d4e5\" data-element_type=\"widget\" data-e-type=\"widget\" data-widget_type=\"heading.default\">\n\t\t\t\t<div class=\"elementor-widget-container\">\n\t\t\t\t\t<div id=\"ez-toc-container\" class=\"ez-toc-v2_0_82_2 counter-hierarchy ez-toc-counter ez-toc-grey ez-toc-container-direction\">\n<div class=\"ez-toc-title-container\">\n<p class=\"ez-toc-title\" style=\"cursor:inherit\">Contenido<\/p>\n<span class=\"ez-toc-title-toggle\"><a href=\"#\" class=\"ez-toc-pull-right ez-toc-btn ez-toc-btn-xs ez-toc-btn-default ez-toc-toggle\" aria-label=\"Tabla de contenido alternativo\"><span class=\"ez-toc-js-icon-con\"><span class=\"\"><span class=\"eztoc-hide\" style=\"display:none;\">Palanca<\/span><span class=\"ez-toc-icon-toggle-span\"><svg style=\"fill: #999;color:#999\" xmlns=\"http:\/\/www.w3.org\/2000\/svg\" class=\"list-377408\" width=\"20px\" height=\"20px\" viewbox=\"0 0 24 24\" fill=\"none\"><path d=\"M6 6H4v2h2V6zm14 0H8v2h12V6zM4 11h2v2H4v-2zm16 0H8v2h12v-2zM4 16h2v2H4v-2zm16 0H8v2h12v-2z\" fill=\"currentColor\"><\/path><\/svg><svg style=\"fill: #999;color:#999\" class=\"arrow-unsorted-368013\" xmlns=\"http:\/\/www.w3.org\/2000\/svg\" width=\"10px\" height=\"10px\" viewbox=\"0 0 24 24\" version=\"1.2\" baseprofile=\"tiny\"><path d=\"M18.2 9.3l-6.2-6.3-6.2 6.3c-.2.2-.3.4-.3.7s.1.5.3.7c.2.2.4.3.7.3h11c.3 0 .5-.1.7-.3.2-.2.3-.5.3-.7s-.1-.5-.3-.7zM5.8 14.7l6.2 6.3 6.2-6.3c.2-.2.3-.5.3-.7s-.1-.5-.3-.7c-.2-.2-.4-.3-.7-.3h-11c-.3 0-.5.1-.7.3-.2.2-.3.5-.3.7s.1.5.3.7z\"\/><\/svg><\/span><\/span><\/span><\/a><\/span><\/div>\n<nav><ul class='ez-toc-list ez-toc-list-level-1' ><li class='ez-toc-page-1 ez-toc-heading-level-2'><a class=\"ez-toc-link ez-toc-heading-1\" href=\"https:\/\/complex-systems-ai.com\/es\/analisis-de-datos\/normalizar-estandarizar-redimensionar-tus-datos\/#Tutoriel-sur-normaliser-standardiser-et-redimensionner-vos-donnees\" >Tutorial sobre c\u00f3mo normalizar, estandarizar y cambiar el tama\u00f1o de sus datos<\/a><\/li><li class='ez-toc-page-1 ez-toc-heading-level-2'><a class=\"ez-toc-link ez-toc-heading-2\" href=\"https:\/\/complex-systems-ai.com\/es\/analisis-de-datos\/normalizar-estandarizar-redimensionar-tus-datos\/#Pourquoi-le-faire\" >\u00bfPor que hacerlo?<\/a><ul class='ez-toc-list-level-3' ><li class='ez-toc-heading-level-3'><a class=\"ez-toc-link ez-toc-heading-3\" href=\"https:\/\/complex-systems-ai.com\/es\/analisis-de-datos\/normalizar-estandarizar-redimensionar-tus-datos\/#Standardisation\" >Estandarizaci\u00f3n:<\/a><\/li><li class='ez-toc-page-1 ez-toc-heading-level-3'><a class=\"ez-toc-link ez-toc-heading-4\" href=\"https:\/\/complex-systems-ai.com\/es\/analisis-de-datos\/normalizar-estandarizar-redimensionar-tus-datos\/#Normalisation\" >Estandarizaci\u00f3n:<\/a><\/li><\/ul><\/li><li class='ez-toc-page-1 ez-toc-heading-level-2'><a class=\"ez-toc-link ez-toc-heading-5\" href=\"https:\/\/complex-systems-ai.com\/es\/analisis-de-datos\/normalizar-estandarizar-redimensionar-tus-datos\/#Quand-le-faire\" >\u00bfCu\u00e1ndo hacerlo?<\/a><\/li><li class='ez-toc-page-1 ez-toc-heading-level-2'><a class=\"ez-toc-link ez-toc-heading-6\" href=\"https:\/\/complex-systems-ai.com\/es\/analisis-de-datos\/normalizar-estandarizar-redimensionar-tus-datos\/#Standardisation-2\" >Estandarizaci\u00f3n<\/a><\/li><li class='ez-toc-page-1 ez-toc-heading-level-2'><a class=\"ez-toc-link ez-toc-heading-7\" href=\"https:\/\/complex-systems-ai.com\/es\/analisis-de-datos\/normalizar-estandarizar-redimensionar-tus-datos\/#Normalisation-2\" >Estandarizaci\u00f3n<\/a><\/li><li class='ez-toc-page-1 ez-toc-heading-level-2'><a class=\"ez-toc-link ez-toc-heading-8\" href=\"https:\/\/complex-systems-ai.com\/es\/analisis-de-datos\/normalizar-estandarizar-redimensionar-tus-datos\/#Mise-a-lechelle-robuste\" >Escalado robusto<\/a><\/li><\/ul><\/nav><\/div>\n<h2 class=\"elementor-heading-title elementor-size-default\"><span class=\"ez-toc-section\" id=\"Tutoriel-sur-normaliser-standardiser-et-redimensionner-vos-donnees\"><\/span>Tutorial sobre c\u00f3mo normalizar, estandarizar y cambiar el tama\u00f1o de sus datos<span class=\"ez-toc-section-end\"><\/span><\/h2>\t\t\t\t<\/div>\n\t\t\t\t<\/div>\n\t\t\t\t\t<\/div>\n\t\t<\/div>\n\t\t\t\t\t<\/div>\n\t\t<\/section>\n\t\t\t\t<section class=\"elementor-section elementor-top-section elementor-element elementor-element-31a25eb elementor-section-boxed elementor-section-height-default elementor-section-height-default\" data-id=\"31a25eb\" data-element_type=\"section\" data-e-type=\"section\">\n\t\t\t\t\t\t<div class=\"elementor-container elementor-column-gap-default\">\n\t\t\t\t\t<div class=\"elementor-column elementor-col-100 elementor-top-column elementor-element elementor-element-418e8b5\" data-id=\"418e8b5\" data-element_type=\"column\" data-e-type=\"column\">\n\t\t\t<div class=\"elementor-widget-wrap elementor-element-populated\">\n\t\t\t\t\t\t<div class=\"elementor-element elementor-element-c9bcf37 elementor-widget elementor-widget-text-editor\" data-id=\"c9bcf37\" data-element_type=\"widget\" data-e-type=\"widget\" data-widget_type=\"text-editor.default\">\n\t\t\t\t<div class=\"elementor-widget-container\">\n\t\t\t\t\t\t\t\t\t<p>Antes de sumergirnos en este tema, comencemos con algunas definiciones.<\/p><p>\u201cRedimensionar\u201d un vector significa sumar o restar una constante, luego multiplicar o dividir por una constante, tal como lo har\u00eda al cambiar las unidades de medida de datos, por ejemplo, para convertir una temperatura de Celsius a Fahrenheit.<\/p><p>\u201cNormalizar\u201d un vector generalmente significa dividir por una norma del vector. Il fait \u00e9galement souvent r\u00e9f\u00e9rence \u00e0 la remise \u00e0 l&#039;\u00e9chelle par le minimum et la plage du vecteur, pour que tous les \u00e9l\u00e9ments se situent entre 0 et 1, amenant ainsi toutes les valeurs des colonnes num\u00e9riques de l&#039;ensemble de donn\u00e9es \u00e0 une \u00e9chelle Com\u00fan.<\/p><p>\u201cEstandarizar\u201d un vector generalmente significa restar una medida de ubicaci\u00f3n y dividir por una medida de escala. Por ejemplo, si el vector contiene valores aleatorios con una distribuci\u00f3n gaussiana, puede restar la media y dividir por la desviaci\u00f3n est\u00e1ndar, obteniendo as\u00ed una variable aleatoria &quot;normal est\u00e1ndar&quot; con una media de 0 y una desviaci\u00f3n est\u00e1ndar de 1.<\/p>\t\t\t\t\t\t\t\t<\/div>\n\t\t\t\t<\/div>\n\t\t\t\t\t<\/div>\n\t\t<\/div>\n\t\t\t\t\t<\/div>\n\t\t<\/section>\n\t\t\t\t<section class=\"elementor-section elementor-top-section elementor-element elementor-element-1b9bc2e elementor-section-boxed elementor-section-height-default elementor-section-height-default\" data-id=\"1b9bc2e\" data-element_type=\"section\" data-e-type=\"section\">\n\t\t\t\t\t\t<div class=\"elementor-container elementor-column-gap-default\">\n\t\t\t\t\t<div class=\"elementor-column elementor-col-100 elementor-top-column elementor-element elementor-element-084cd89\" data-id=\"084cd89\" data-element_type=\"column\" data-e-type=\"column\">\n\t\t\t<div class=\"elementor-widget-wrap elementor-element-populated\">\n\t\t\t\t\t\t<div class=\"elementor-element elementor-element-68d224f elementor-widget elementor-widget-heading\" data-id=\"68d224f\" data-element_type=\"widget\" data-e-type=\"widget\" data-widget_type=\"heading.default\">\n\t\t\t\t<div class=\"elementor-widget-container\">\n\t\t\t\t\t<h2 class=\"elementor-heading-title elementor-size-default\"><span class=\"ez-toc-section\" id=\"Pourquoi-le-faire\"><\/span>\u00bfPor que hacerlo?<span class=\"ez-toc-section-end\"><\/span><\/h2>\t\t\t\t<\/div>\n\t\t\t\t<\/div>\n\t\t\t\t\t<\/div>\n\t\t<\/div>\n\t\t\t\t\t<\/div>\n\t\t<\/section>\n\t\t\t\t<section class=\"elementor-section elementor-top-section elementor-element elementor-element-a5af20b elementor-section-boxed elementor-section-height-default elementor-section-height-default\" data-id=\"a5af20b\" data-element_type=\"section\" data-e-type=\"section\">\n\t\t\t\t\t\t<div class=\"elementor-container elementor-column-gap-default\">\n\t\t\t\t\t<div class=\"elementor-column elementor-col-100 elementor-top-column elementor-element elementor-element-109a285\" data-id=\"109a285\" data-element_type=\"column\" data-e-type=\"column\">\n\t\t\t<div class=\"elementor-widget-wrap elementor-element-populated\">\n\t\t\t\t\t\t<div class=\"elementor-element elementor-element-bb45941 elementor-widget elementor-widget-text-editor\" data-id=\"bb45941\" data-element_type=\"widget\" data-e-type=\"widget\" data-widget_type=\"text-editor.default\">\n\t\t\t\t<div class=\"elementor-widget-container\">\n\t\t\t\t\t\t\t\t\t<h3><span class=\"ez-toc-section\" id=\"Standardisation\"><\/span>Estandarizaci\u00f3n:<span class=\"ez-toc-section-end\"><\/span><\/h3><p>Estandarizar caracter\u00edsticas alrededor del centro y 0 con una desviaci\u00f3n est\u00e1ndar de 1 es importante cuando se comparan medidas que tienen diferentes unidades. Las variables medidas en diferentes escalas no contribuyen por igual al an\u00e1lisis y pueden terminar creando un sesgo.<\/p><p>Por ejemplo, una variable entre 0 y 1000 tendr\u00e1 m\u00e1s peso que una variable entre 0 y 1. El uso de estas variables sin estandarizaci\u00f3n dar\u00e1 como resultado la variable con el peso del rango m\u00e1s amplio de 1000 en el an\u00e1lisis. Transformar los datos a escalas comparables puede evitar este problema. Los procedimientos t\u00edpicos de normalizaci\u00f3n de datos igualan el rango y\/o la variabilidad de los datos.<\/p><h3><span class=\"ez-toc-section\" id=\"Normalisation\"><\/span>Estandarizaci\u00f3n:<span class=\"ez-toc-section-end\"><\/span><\/h3><p>De manera similar, el prop\u00f3sito de la normalizaci\u00f3n es cambiar los valores de las columnas num\u00e9ricas del conjunto de datos a una escala com\u00fan, sin distorsionar las diferencias en los rangos de valores. Para el aprendizaje autom\u00e1tico, cada conjunto de datos no requiere normalizaci\u00f3n. Solo se requiere cuando las caracter\u00edsticas tienen diferentes rangos.<\/p><p>Por ejemplo, considere un conjunto de datos que contiene dos caracter\u00edsticas, edad e ingresos (x2). Donde la edad oscila entre 0 y 100, mientras que los ingresos oscilan entre 0 y 100.000 y m\u00e1s. Los ingresos son unas 1.000 veces superiores a la edad. As\u00ed, estas dos caracter\u00edsticas se encuentran en rangos muy diferentes. Cuando hacemos un an\u00e1lisis m\u00e1s profundo, como el <a href=\"https:\/\/complex-systems-ai.com\/es\/correlacion-y-regresiones\/transformacion-de-datos-y-regresion\/\">regresi\u00f3n<\/a> multivariado lineal, por ejemplo, el ingreso asignado intr\u00ednsecamente influir\u00e1 m\u00e1s en el resultado debido a su mayor valor. Pero eso no significa necesariamente que sea m\u00e1s importante como predictor. As\u00ed que normalizamos los datos para llevar todas las variables al mismo rango.<\/p>\t\t\t\t\t\t\t\t<\/div>\n\t\t\t\t<\/div>\n\t\t\t\t\t<\/div>\n\t\t<\/div>\n\t\t\t\t\t<\/div>\n\t\t<\/section>\n\t\t\t\t<section class=\"elementor-section elementor-top-section elementor-element elementor-element-551407a elementor-section-boxed elementor-section-height-default elementor-section-height-default\" data-id=\"551407a\" data-element_type=\"section\" data-e-type=\"section\">\n\t\t\t\t\t\t<div class=\"elementor-container elementor-column-gap-default\">\n\t\t\t\t\t<div class=\"elementor-column elementor-col-100 elementor-top-column elementor-element elementor-element-9c5dda4\" data-id=\"9c5dda4\" data-element_type=\"column\" data-e-type=\"column\">\n\t\t\t<div class=\"elementor-widget-wrap elementor-element-populated\">\n\t\t\t\t\t\t<div class=\"elementor-element elementor-element-5006b93 elementor-widget elementor-widget-heading\" data-id=\"5006b93\" data-element_type=\"widget\" data-e-type=\"widget\" data-widget_type=\"heading.default\">\n\t\t\t\t<div class=\"elementor-widget-container\">\n\t\t\t\t\t<h2 class=\"elementor-heading-title elementor-size-default\"><span class=\"ez-toc-section\" id=\"Quand-le-faire\"><\/span>\u00bfCu\u00e1ndo hacerlo?<span class=\"ez-toc-section-end\"><\/span><\/h2>\t\t\t\t<\/div>\n\t\t\t\t<\/div>\n\t\t\t\t\t<\/div>\n\t\t<\/div>\n\t\t\t\t\t<\/div>\n\t\t<\/section>\n\t\t\t\t<section class=\"elementor-section elementor-top-section elementor-element elementor-element-ce3a55d elementor-section-boxed elementor-section-height-default elementor-section-height-default\" data-id=\"ce3a55d\" data-element_type=\"section\" data-e-type=\"section\">\n\t\t\t\t\t\t<div class=\"elementor-container elementor-column-gap-default\">\n\t\t\t\t\t<div class=\"elementor-column elementor-col-100 elementor-top-column elementor-element elementor-element-3473571\" data-id=\"3473571\" data-element_type=\"column\" data-e-type=\"column\">\n\t\t\t<div class=\"elementor-widget-wrap elementor-element-populated\">\n\t\t\t\t\t\t<div class=\"elementor-element elementor-element-d8490c4 elementor-widget elementor-widget-text-editor\" data-id=\"d8490c4\" data-element_type=\"widget\" data-e-type=\"widget\" data-widget_type=\"text-editor.default\">\n\t\t\t\t<div class=\"elementor-widget-container\">\n\t\t\t\t\t\t\t\t\t<p>La normalizaci\u00f3n es una buena t\u00e9cnica para usar cuando no conoce la distribuci\u00f3n de sus datos o cuando sabe que la distribuci\u00f3n no es gaussiana (una curva de campana). La normalizaci\u00f3n es \u00fatil cuando sus datos tienen escalas variables y el algoritmo que est\u00e1 utilizando no hace suposiciones sobre la distribuci\u00f3n de sus datos, como k vecinos m\u00e1s cercanos y redes de <a href=\"https:\/\/complex-systems-ai.com\/es\/algoritmos-neuronales\/perceptron-es\/\">neuronas<\/a> artificial.<\/p><p>La estandarizaci\u00f3n asume que sus datos tienen una distribuci\u00f3n gaussiana (curva de campana). Esto no tiene por qu\u00e9 ser cierto, pero la t\u00e9cnica es m\u00e1s eficiente si su distribuci\u00f3n de atributos es gaussiana. La estandarizaci\u00f3n es \u00fatil cuando sus datos tienen escalas variables y el algoritmo que est\u00e1 utilizando hace suposiciones acerca de que sus datos tienen una distribuci\u00f3n gaussiana, como regresi\u00f3n lineal, regresi\u00f3n log\u00edstica y an\u00e1lisis discriminante lineal.<\/p>\t\t\t\t\t\t\t\t<\/div>\n\t\t\t\t<\/div>\n\t\t\t\t\t<\/div>\n\t\t<\/div>\n\t\t\t\t\t<\/div>\n\t\t<\/section>\n\t\t\t\t<section class=\"elementor-section elementor-top-section elementor-element elementor-element-8e53005 elementor-section-boxed elementor-section-height-default elementor-section-height-default\" data-id=\"8e53005\" data-element_type=\"section\" data-e-type=\"section\">\n\t\t\t\t\t\t<div class=\"elementor-container elementor-column-gap-default\">\n\t\t\t\t\t<div class=\"elementor-column elementor-col-100 elementor-top-column elementor-element elementor-element-0d1c71f\" data-id=\"0d1c71f\" data-element_type=\"column\" data-e-type=\"column\">\n\t\t\t<div class=\"elementor-widget-wrap elementor-element-populated\">\n\t\t\t\t\t\t<div class=\"elementor-element elementor-element-160c2b2 elementor-widget elementor-widget-heading\" data-id=\"160c2b2\" data-element_type=\"widget\" data-e-type=\"widget\" data-widget_type=\"heading.default\">\n\t\t\t\t<div class=\"elementor-widget-container\">\n\t\t\t\t\t<h2 class=\"elementor-heading-title elementor-size-default\"><span class=\"ez-toc-section\" id=\"Standardisation-2\"><\/span>Estandarizaci\u00f3n<span class=\"ez-toc-section-end\"><\/span><\/h2>\t\t\t\t<\/div>\n\t\t\t\t<\/div>\n\t\t\t\t\t<\/div>\n\t\t<\/div>\n\t\t\t\t\t<\/div>\n\t\t<\/section>\n\t\t\t\t<section class=\"elementor-section elementor-top-section elementor-element elementor-element-4474026 elementor-section-boxed elementor-section-height-default elementor-section-height-default\" data-id=\"4474026\" data-element_type=\"section\" data-e-type=\"section\">\n\t\t\t\t\t\t<div class=\"elementor-container elementor-column-gap-default\">\n\t\t\t\t\t<div class=\"elementor-column elementor-col-100 elementor-top-column elementor-element elementor-element-c445d3c\" data-id=\"c445d3c\" data-element_type=\"column\" data-e-type=\"column\">\n\t\t\t<div class=\"elementor-widget-wrap elementor-element-populated\">\n\t\t\t\t\t\t<div class=\"elementor-element elementor-element-3d5ed97 elementor-widget elementor-widget-text-editor\" data-id=\"3d5ed97\" data-element_type=\"widget\" data-e-type=\"widget\" data-widget_type=\"text-editor.default\">\n\t\t\t\t<div class=\"elementor-widget-container\">\n\t\t\t\t\t\t\t\t\t<p>Como vimos anteriormente, la estandarizaci\u00f3n (o normalizaci\u00f3n del puntaje Z) significa centrar la variable en cero y estandarizar la varianza en 1. El procedimiento consiste en restar la media de cada observaci\u00f3n y luego dividirla por la desviaci\u00f3n est\u00e1ndar.<\/p><p>El resultado de la normalizaci\u00f3n es que las caracter\u00edsticas se escalar\u00e1n para que tengan las propiedades de una distribuci\u00f3n normal est\u00e1ndar con<\/p><pre>\u03bc=0 y \u03c3=1<\/pre><p>donde \u03bc es la media (media) y \u03c3 es la desviaci\u00f3n est\u00e1ndar de la media.<\/p><p>StandardScaler de scikit-learn elimina la media y escala los datos por varianza de unidad. Podemos importar el m\u00e9todo StandardScaler de sci-kit learn y aplicarlo a nuestro conjunto de datos.<\/p><pre>from sklearn.preprocessing import StandardScaler scaler = StandardScaler() data_scaled = scaler.fit_transform(data)<\/pre><p>Ahora vamos a comprobar los valores de media y desviaci\u00f3n est\u00e1ndar.<\/p><pre>print(data_scaled.mean(axis=0)) print(data_scaled.std(axis=0))<\/pre><figure><img decoding=\"async\" class=\"aligncenter wp-image-15822 size-full\" src=\"https:\/\/complex-systems-ai.com\/wp-content\/uploads\/2022\/04\/1_BghCKrhOG5LI4dvpv8LPBw.png\" alt=\"\" width=\"403\" height=\"45\" title=\"\" srcset=\"https:\/\/complex-systems-ai.com\/wp-content\/uploads\/2022\/04\/1_BghCKrhOG5LI4dvpv8LPBw.png 403w, https:\/\/complex-systems-ai.com\/wp-content\/uploads\/2022\/04\/1_BghCKrhOG5LI4dvpv8LPBw-300x33.png 300w, https:\/\/complex-systems-ai.com\/wp-content\/uploads\/2022\/04\/1_BghCKrhOG5LI4dvpv8LPBw-18x2.png 18w\" sizes=\"(max-width: 403px) 100vw, 403px\" \/><\/figure><p>Como era de esperar, la media de cada variable ahora est\u00e1 alrededor de cero y la desviaci\u00f3n est\u00e1ndar se establece en 1. Entonces, todos los valores de las variables est\u00e1n en el mismo rango.<\/p><pre>print(&#039;Valores m\u00ednimos (Importe del Pr\u00e9stamo, Tasa Int y Cuota): &#039;, data_scaled.min(axis=0)) print(&#039;Valores M\u00e1x. (Importe del Pr\u00e9stamo, Tasa Int y Cuota): &#039;, data_scaled.max (eje=0 ))<\/pre><figure><img decoding=\"async\" class=\"aligncenter wp-image-15823 size-full\" src=\"https:\/\/complex-systems-ai.com\/wp-content\/uploads\/2022\/04\/1_CsnAGwpCvV74nAM1hoTyLw.png\" alt=\"\" width=\"714\" height=\"41\" title=\"\" srcset=\"https:\/\/complex-systems-ai.com\/wp-content\/uploads\/2022\/04\/1_CsnAGwpCvV74nAM1hoTyLw.png 714w, https:\/\/complex-systems-ai.com\/wp-content\/uploads\/2022\/04\/1_CsnAGwpCvV74nAM1hoTyLw-300x17.png 300w, https:\/\/complex-systems-ai.com\/wp-content\/uploads\/2022\/04\/1_CsnAGwpCvV74nAM1hoTyLw-18x1.png 18w, https:\/\/complex-systems-ai.com\/wp-content\/uploads\/2022\/04\/1_CsnAGwpCvV74nAM1hoTyLw-700x41.png 700w, https:\/\/complex-systems-ai.com\/wp-content\/uploads\/2022\/04\/1_CsnAGwpCvV74nAM1hoTyLw-600x34.png 600w\" sizes=\"(max-width: 714px) 100vw, 714px\" \/><\/figure><p>Sin embargo, los valores m\u00ednimo y m\u00e1ximo var\u00edan seg\u00fan la dispersi\u00f3n inicial de la variable y est\u00e1n fuertemente influenciados por la presencia de valores at\u00edpicos.<\/p>\t\t\t\t\t\t\t\t<\/div>\n\t\t\t\t<\/div>\n\t\t\t\t\t<\/div>\n\t\t<\/div>\n\t\t\t\t\t<\/div>\n\t\t<\/section>\n\t\t\t\t<section class=\"elementor-section elementor-top-section elementor-element elementor-element-91ff185 elementor-section-boxed elementor-section-height-default elementor-section-height-default\" data-id=\"91ff185\" data-element_type=\"section\" data-e-type=\"section\">\n\t\t\t\t\t\t<div class=\"elementor-container elementor-column-gap-default\">\n\t\t\t\t\t<div class=\"elementor-column elementor-col-100 elementor-top-column elementor-element elementor-element-976275a\" data-id=\"976275a\" data-element_type=\"column\" data-e-type=\"column\">\n\t\t\t<div class=\"elementor-widget-wrap elementor-element-populated\">\n\t\t\t\t\t\t<div class=\"elementor-element elementor-element-e486c3c elementor-widget elementor-widget-heading\" data-id=\"e486c3c\" data-element_type=\"widget\" data-e-type=\"widget\" data-widget_type=\"heading.default\">\n\t\t\t\t<div class=\"elementor-widget-container\">\n\t\t\t\t\t<h2 class=\"elementor-heading-title elementor-size-default\"><span class=\"ez-toc-section\" id=\"Normalisation-2\"><\/span>Estandarizaci\u00f3n<span class=\"ez-toc-section-end\"><\/span><\/h2>\t\t\t\t<\/div>\n\t\t\t\t<\/div>\n\t\t\t\t\t<\/div>\n\t\t<\/div>\n\t\t\t\t\t<\/div>\n\t\t<\/section>\n\t\t\t\t<section class=\"elementor-section elementor-top-section elementor-element elementor-element-676d42f elementor-section-boxed elementor-section-height-default elementor-section-height-default\" data-id=\"676d42f\" data-element_type=\"section\" data-e-type=\"section\">\n\t\t\t\t\t\t<div class=\"elementor-container elementor-column-gap-default\">\n\t\t\t\t\t<div class=\"elementor-column elementor-col-100 elementor-top-column elementor-element elementor-element-a0a81e7\" data-id=\"a0a81e7\" data-element_type=\"column\" data-e-type=\"column\">\n\t\t\t<div class=\"elementor-widget-wrap elementor-element-populated\">\n\t\t\t\t\t\t<div class=\"elementor-element elementor-element-ee13b05 elementor-widget elementor-widget-text-editor\" data-id=\"ee13b05\" data-element_type=\"widget\" data-e-type=\"widget\" data-widget_type=\"text-editor.default\">\n\t\t\t\t<div class=\"elementor-widget-container\">\n\t\t\t\t\t\t\t\t\t<p>En este enfoque, los datos se escalan en un rango fijo, generalmente de 0 a 1.<\/p><p>A diferencia de la normalizaci\u00f3n, el costo de tener este rango acotado es que terminaremos con desviaciones est\u00e1ndar m\u00e1s peque\u00f1as, lo que puede eliminar el efecto de los valores at\u00edpicos. Por lo tanto, MinMax Scalar es sensible a los valores at\u00edpicos.<\/p><p>El escalado Min-Max generalmente se realiza a trav\u00e9s de la siguiente ecuaci\u00f3n:<\/p><p><img loading=\"lazy\" decoding=\"async\" class=\"aligncenter size-full wp-image-15824\" src=\"https:\/\/complex-systems-ai.com\/wp-content\/uploads\/2022\/04\/1_Dl3P3Rrzto258X0Ales9Xw.png\" alt=\"\" width=\"253\" height=\"119\" title=\"\" srcset=\"https:\/\/complex-systems-ai.com\/wp-content\/uploads\/2022\/04\/1_Dl3P3Rrzto258X0Ales9Xw.png 253w, https:\/\/complex-systems-ai.com\/wp-content\/uploads\/2022\/04\/1_Dl3P3Rrzto258X0Ales9Xw-18x8.png 18w\" sizes=\"(max-width: 253px) 100vw, 253px\" \/><\/p><p>Importemos MinMaxScalar de Scikit-learn y apl\u00edquelo a nuestro conjunto de datos.<\/p><pre>from sklearn.preprocessing import MinMaxScaler scaler = MinMaxScaler() data_scaled = scaler.fit_transform(data)<\/pre><p>Ahora vamos a comprobar los valores de media y desviaci\u00f3n est\u00e1ndar.<\/p><pre>print(&#039;significa (monto del pr\u00e9stamo, tasa interna y cuota): &#039;, data_scaled.mean(axis=0)) print(&#039;std (monto del pr\u00e9stamo, tasa interna y cuota): &#039;, data_scaled.std(axis=0))<\/pre><figure><img loading=\"lazy\" decoding=\"async\" class=\"aligncenter wp-image-15825 size-full\" src=\"https:\/\/complex-systems-ai.com\/wp-content\/uploads\/2022\/04\/1__mpW5DJn4PV-jQF20TmvzQ.png\" alt=\"\" width=\"658\" height=\"47\" title=\"\" srcset=\"https:\/\/complex-systems-ai.com\/wp-content\/uploads\/2022\/04\/1__mpW5DJn4PV-jQF20TmvzQ.png 658w, https:\/\/complex-systems-ai.com\/wp-content\/uploads\/2022\/04\/1__mpW5DJn4PV-jQF20TmvzQ-300x21.png 300w, https:\/\/complex-systems-ai.com\/wp-content\/uploads\/2022\/04\/1__mpW5DJn4PV-jQF20TmvzQ-18x1.png 18w, https:\/\/complex-systems-ai.com\/wp-content\/uploads\/2022\/04\/1__mpW5DJn4PV-jQF20TmvzQ-600x43.png 600w\" sizes=\"(max-width: 658px) 100vw, 658px\" \/><\/figure><p>Despu\u00e9s de MinMaxScaling, las distribuciones no se centran en cero y la desviaci\u00f3n est\u00e1ndar no es 1.<\/p><pre>print(&#039;Min (Importe del Pr\u00e9stamo, Tasa Int y Cuota): &#039;, data_scaled.min(axis=0)) print(&#039;Max (Importe del Pr\u00e9stamo, Tasa Int y Cuota): &#039;, data_scaled.max(axis=0))<\/pre><figure><img loading=\"lazy\" decoding=\"async\" class=\"aligncenter wp-image-15826 size-full\" src=\"https:\/\/complex-systems-ai.com\/wp-content\/uploads\/2022\/04\/1_Tl79_PxbpPvE-w1FXZX86g.png\" alt=\"\" width=\"518\" height=\"48\" title=\"\" srcset=\"https:\/\/complex-systems-ai.com\/wp-content\/uploads\/2022\/04\/1_Tl79_PxbpPvE-w1FXZX86g.png 518w, https:\/\/complex-systems-ai.com\/wp-content\/uploads\/2022\/04\/1_Tl79_PxbpPvE-w1FXZX86g-300x28.png 300w, https:\/\/complex-systems-ai.com\/wp-content\/uploads\/2022\/04\/1_Tl79_PxbpPvE-w1FXZX86g-18x2.png 18w\" sizes=\"(max-width: 518px) 100vw, 518px\" \/><\/figure><p>Pero los valores m\u00ednimos y m\u00e1ximos est\u00e1n normalizados entre las variables, a diferencia de lo que sucede con la estandarizaci\u00f3n.<\/p>\t\t\t\t\t\t\t\t<\/div>\n\t\t\t\t<\/div>\n\t\t\t\t\t<\/div>\n\t\t<\/div>\n\t\t\t\t\t<\/div>\n\t\t<\/section>\n\t\t\t\t<section class=\"elementor-section elementor-top-section elementor-element elementor-element-7363e3c elementor-section-boxed elementor-section-height-default elementor-section-height-default\" data-id=\"7363e3c\" data-element_type=\"section\" data-e-type=\"section\">\n\t\t\t\t\t\t<div class=\"elementor-container elementor-column-gap-default\">\n\t\t\t\t\t<div class=\"elementor-column elementor-col-100 elementor-top-column elementor-element elementor-element-d16a83e\" data-id=\"d16a83e\" data-element_type=\"column\" data-e-type=\"column\">\n\t\t\t<div class=\"elementor-widget-wrap elementor-element-populated\">\n\t\t\t\t\t\t<div class=\"elementor-element elementor-element-0796c14 elementor-widget elementor-widget-heading\" data-id=\"0796c14\" data-element_type=\"widget\" data-e-type=\"widget\" data-widget_type=\"heading.default\">\n\t\t\t\t<div class=\"elementor-widget-container\">\n\t\t\t\t\t<h2 class=\"elementor-heading-title elementor-size-default\"><span class=\"ez-toc-section\" id=\"Mise-a-lechelle-robuste\"><\/span>Escalado robusto<span class=\"ez-toc-section-end\"><\/span><\/h2>\t\t\t\t<\/div>\n\t\t\t\t<\/div>\n\t\t\t\t\t<\/div>\n\t\t<\/div>\n\t\t\t\t\t<\/div>\n\t\t<\/section>\n\t\t\t\t<section class=\"elementor-section elementor-top-section elementor-element elementor-element-97285c6 elementor-section-boxed elementor-section-height-default elementor-section-height-default\" data-id=\"97285c6\" data-element_type=\"section\" data-e-type=\"section\">\n\t\t\t\t\t\t<div class=\"elementor-container elementor-column-gap-default\">\n\t\t\t\t\t<div class=\"elementor-column elementor-col-100 elementor-top-column elementor-element elementor-element-5dc402d\" data-id=\"5dc402d\" data-element_type=\"column\" data-e-type=\"column\">\n\t\t\t<div class=\"elementor-widget-wrap elementor-element-populated\">\n\t\t\t\t\t\t<div class=\"elementor-element elementor-element-5378053 elementor-widget elementor-widget-text-editor\" data-id=\"5378053\" data-element_type=\"widget\" data-e-type=\"widget\" data-widget_type=\"text-editor.default\">\n\t\t\t\t<div class=\"elementor-widget-container\">\n\t\t\t\t\t\t\t\t\t<p>Escalar usando la mediana y los cuantiles consiste en restar la mediana de todas las observaciones y luego dividir por la diferencia intercuartil. Escala caracter\u00edsticas usando estad\u00edsticas que son resistentes a los valores at\u00edpicos.<\/p><p>La diferencia intercuartil es la diferencia entre el cuantil 75 y el 25:<\/p><pre>IQR = cuantil 75 \u2014 cuantil 25<\/pre><p>La ecuaci\u00f3n para calcular los valores escalados:<\/p><pre>X_scaled = (X \u2014 X.median) \/ IQR<\/pre><p>Primero, importe RobustScalar desde Scikit learn.<\/p><pre>from sklearn.preprocessing import RobustScaler scaler = RobustScaler() data_scaled = scaler.fit_transform(data)<\/pre><p>Ahora verifique los valores de media y desviaci\u00f3n est\u00e1ndar.<\/p><pre>print(&#039;significa (monto del pr\u00e9stamo, tasa interna y cuota): &#039;, data_scaled.mean(axis=0)) print(&#039;std (monto del pr\u00e9stamo, tasa interna y cuota): &#039;, data_scaled.std(axis=0))<\/pre><figure><img loading=\"lazy\" decoding=\"async\" class=\"aligncenter wp-image-15827 size-full\" src=\"https:\/\/complex-systems-ai.com\/wp-content\/uploads\/2022\/04\/1_z11apSE2Nns7OX0Cp2Cq_A.png\" alt=\"\" width=\"668\" height=\"47\" title=\"\" srcset=\"https:\/\/complex-systems-ai.com\/wp-content\/uploads\/2022\/04\/1_z11apSE2Nns7OX0Cp2Cq_A.png 668w, https:\/\/complex-systems-ai.com\/wp-content\/uploads\/2022\/04\/1_z11apSE2Nns7OX0Cp2Cq_A-300x21.png 300w, https:\/\/complex-systems-ai.com\/wp-content\/uploads\/2022\/04\/1_z11apSE2Nns7OX0Cp2Cq_A-18x1.png 18w, https:\/\/complex-systems-ai.com\/wp-content\/uploads\/2022\/04\/1_z11apSE2Nns7OX0Cp2Cq_A-600x42.png 600w\" sizes=\"(max-width: 668px) 100vw, 668px\" \/><\/figure><p>Como puede ver, las distribuciones no est\u00e1n centradas en cero y la desviaci\u00f3n est\u00e1ndar no es 1.<\/p><pre>print(&#039;Min (Importe del Pr\u00e9stamo, Tasa Int y Cuota): &#039;, data_scaled.min(axis=0)) print(&#039;Max (Importe del Pr\u00e9stamo, Tasa Int y Cuota): &#039;, data_scaled.max(axis=0))<\/pre><figure><img loading=\"lazy\" decoding=\"async\" class=\"aligncenter wp-image-15828 size-full\" src=\"https:\/\/complex-systems-ai.com\/wp-content\/uploads\/2022\/04\/1_YqdzBL92Ww8foaaSTry1Ow.png\" alt=\"\" width=\"677\" height=\"40\" title=\"\" srcset=\"https:\/\/complex-systems-ai.com\/wp-content\/uploads\/2022\/04\/1_YqdzBL92Ww8foaaSTry1Ow.png 677w, https:\/\/complex-systems-ai.com\/wp-content\/uploads\/2022\/04\/1_YqdzBL92Ww8foaaSTry1Ow-300x18.png 300w, https:\/\/complex-systems-ai.com\/wp-content\/uploads\/2022\/04\/1_YqdzBL92Ww8foaaSTry1Ow-18x1.png 18w, https:\/\/complex-systems-ai.com\/wp-content\/uploads\/2022\/04\/1_YqdzBL92Ww8foaaSTry1Ow-600x35.png 600w\" sizes=\"(max-width: 677px) 100vw, 677px\" \/><\/figure><p>Los valores m\u00ednimo y m\u00e1ximo tampoco se establecen en algunos l\u00edmites superior e inferior como en MinMaxScaler.<\/p>\t\t\t\t\t\t\t\t<\/div>\n\t\t\t\t<\/div>\n\t\t\t\t\t<\/div>\n\t\t<\/div>\n\t\t\t\t\t<\/div>\n\t\t<\/section>\n\t\t\t\t<\/div>","protected":false},"excerpt":{"rendered":"<p>P\u00e1gina de inicio de Wiki de an\u00e1lisis de datos Para poder analizar sus datos y realizar cualquier procesamiento previo o de reducci\u00f3n, es muy \u2026 <\/p>","protected":false},"author":1,"featured_media":0,"parent":15503,"menu_order":0,"comment_status":"closed","ping_status":"closed","template":"","meta":{"footnotes":""},"class_list":["post-15816","page","type-page","status-publish","hentry"],"amp_enabled":true,"_links":{"self":[{"href":"https:\/\/complex-systems-ai.com\/es\/wp-json\/wp\/v2\/pages\/15816","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/complex-systems-ai.com\/es\/wp-json\/wp\/v2\/pages"}],"about":[{"href":"https:\/\/complex-systems-ai.com\/es\/wp-json\/wp\/v2\/types\/page"}],"author":[{"embeddable":true,"href":"https:\/\/complex-systems-ai.com\/es\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/complex-systems-ai.com\/es\/wp-json\/wp\/v2\/comments?post=15816"}],"version-history":[{"count":3,"href":"https:\/\/complex-systems-ai.com\/es\/wp-json\/wp\/v2\/pages\/15816\/revisions"}],"predecessor-version":[{"id":15831,"href":"https:\/\/complex-systems-ai.com\/es\/wp-json\/wp\/v2\/pages\/15816\/revisions\/15831"}],"up":[{"embeddable":true,"href":"https:\/\/complex-systems-ai.com\/es\/wp-json\/wp\/v2\/pages\/15503"}],"wp:attachment":[{"href":"https:\/\/complex-systems-ai.com\/es\/wp-json\/wp\/v2\/media?parent=15816"}],"curies":[{"name":"gracias","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}