{"id":15734,"date":"2022-04-23T16:34:31","date_gmt":"2022-04-23T15:34:31","guid":{"rendered":"https:\/\/complex-systems-ai.com\/?page_id=15734"},"modified":"2022-04-23T17:37:28","modified_gmt":"2022-04-23T16:37:28","slug":"bonnes-pratiques-de-lanalyse-exploratoire-des-donnees","status":"publish","type":"page","link":"https:\/\/complex-systems-ai.com\/es\/analisis-descriptivo\/buenas-practicas-para-analisis-exploratorio-de-datos\/","title":{"rendered":"Mejores pr\u00e1cticas para el an\u00e1lisis exploratorio de datos"},"content":{"rendered":"<div data-elementor-type=\"wp-page\" data-elementor-id=\"15734\" class=\"elementor elementor-15734\">\n\t\t\t\t\t\t<section class=\"elementor-section elementor-top-section elementor-element elementor-element-d30f757 elementor-section-boxed elementor-section-height-default elementor-section-height-default\" data-id=\"d30f757\" data-element_type=\"section\" data-e-type=\"section\">\n\t\t\t\t\t\t<div class=\"elementor-container elementor-column-gap-default\">\n\t\t\t\t\t<div class=\"elementor-column elementor-col-33 elementor-top-column elementor-element elementor-element-425e02b\" data-id=\"425e02b\" data-element_type=\"column\" data-e-type=\"column\">\n\t\t\t<div class=\"elementor-widget-wrap elementor-element-populated\">\n\t\t\t\t\t\t<div class=\"elementor-element elementor-element-e9c359d elementor-align-justify elementor-widget elementor-widget-button\" data-id=\"e9c359d\" data-element_type=\"widget\" data-e-type=\"widget\" data-widget_type=\"button.default\">\n\t\t\t\t<div class=\"elementor-widget-container\">\n\t\t\t\t\t\t\t\t\t<div class=\"elementor-button-wrapper\">\n\t\t\t\t\t<a class=\"elementor-button elementor-button-link elementor-size-sm\" href=\"https:\/\/complex-systems-ai.com\/es\/analisis-descriptivo\/\">\n\t\t\t\t\t\t<span class=\"elementor-button-content-wrapper\">\n\t\t\t\t\t\t\t\t\t<span class=\"elementor-button-text\">An\u00e1lisis descriptivo<\/span>\n\t\t\t\t\t<\/span>\n\t\t\t\t\t<\/a>\n\t\t\t\t<\/div>\n\t\t\t\t\t\t\t\t<\/div>\n\t\t\t\t<\/div>\n\t\t\t\t\t<\/div>\n\t\t<\/div>\n\t\t\t\t<div class=\"elementor-column elementor-col-33 elementor-top-column elementor-element elementor-element-b5e9124\" data-id=\"b5e9124\" data-element_type=\"column\" data-e-type=\"column\">\n\t\t\t<div class=\"elementor-widget-wrap elementor-element-populated\">\n\t\t\t\t\t\t<div class=\"elementor-element elementor-element-e8b604f elementor-align-justify elementor-widget elementor-widget-button\" data-id=\"e8b604f\" data-element_type=\"widget\" data-e-type=\"widget\" data-widget_type=\"button.default\">\n\t\t\t\t<div class=\"elementor-widget-container\">\n\t\t\t\t\t\t\t\t\t<div class=\"elementor-button-wrapper\">\n\t\t\t\t\t<a class=\"elementor-button elementor-button-link elementor-size-sm\" href=\"https:\/\/complex-systems-ai.com\/es\/\">\n\t\t\t\t\t\t<span class=\"elementor-button-content-wrapper\">\n\t\t\t\t\t\t\t\t\t<span class=\"elementor-button-text\">Pagina de inicio<\/span>\n\t\t\t\t\t<\/span>\n\t\t\t\t\t<\/a>\n\t\t\t\t<\/div>\n\t\t\t\t\t\t\t\t<\/div>\n\t\t\t\t<\/div>\n\t\t\t\t\t<\/div>\n\t\t<\/div>\n\t\t\t\t<div class=\"elementor-column elementor-col-33 elementor-top-column elementor-element elementor-element-a11f34a\" data-id=\"a11f34a\" data-element_type=\"column\" data-e-type=\"column\">\n\t\t\t<div class=\"elementor-widget-wrap elementor-element-populated\">\n\t\t\t\t\t\t<div class=\"elementor-element elementor-element-818b9ec elementor-align-justify elementor-widget elementor-widget-button\" data-id=\"818b9ec\" data-element_type=\"widget\" data-e-type=\"widget\" data-widget_type=\"button.default\">\n\t\t\t\t<div class=\"elementor-widget-container\">\n\t\t\t\t\t\t\t\t\t<div class=\"elementor-button-wrapper\">\n\t\t\t\t\t<a class=\"elementor-button elementor-button-link elementor-size-sm\" href=\"https:\/\/en.wikipedia.org\/wiki\/Descriptive_statistics\" target=\"_blank\" rel=\"noopener\">\n\t\t\t\t\t\t<span class=\"elementor-button-content-wrapper\">\n\t\t\t\t\t\t\t\t\t<span class=\"elementor-button-text\">Wiki<\/span>\n\t\t\t\t\t<\/span>\n\t\t\t\t\t<\/a>\n\t\t\t\t<\/div>\n\t\t\t\t\t\t\t\t<\/div>\n\t\t\t\t<\/div>\n\t\t\t\t\t<\/div>\n\t\t<\/div>\n\t\t\t\t\t<\/div>\n\t\t<\/section>\n\t\t\t\t<section class=\"elementor-section elementor-top-section elementor-element elementor-element-9ad47e1 elementor-section-boxed elementor-section-height-default elementor-section-height-default\" data-id=\"9ad47e1\" data-element_type=\"section\" data-e-type=\"section\">\n\t\t\t\t\t\t<div class=\"elementor-container elementor-column-gap-default\">\n\t\t\t\t\t<div class=\"elementor-column elementor-col-100 elementor-top-column elementor-element elementor-element-d4e86eb\" data-id=\"d4e86eb\" data-element_type=\"column\" data-e-type=\"column\">\n\t\t\t<div class=\"elementor-widget-wrap elementor-element-populated\">\n\t\t\t\t\t\t<div class=\"elementor-element elementor-element-a69827d elementor-widget elementor-widget-text-editor\" data-id=\"a69827d\" data-element_type=\"widget\" data-e-type=\"widget\" data-widget_type=\"text-editor.default\">\n\t\t\t\t<div class=\"elementor-widget-container\">\n\t\t\t\t\t\t\t\t\t<p>Esta p\u00e1gina describe las mejores pr\u00e1cticas para el an\u00e1lisis exploratorio de datos: qu\u00e9 hacer con un conjunto de datos para comprender su contenido.<\/p><p><img decoding=\"async\" class=\"aligncenter wp-image-11096 size-full\" src=\"https:\/\/complex-systems-ai.com\/wp-content\/uploads\/2020\/09\/cropped-Capture.png\" alt=\"mejores pr\u00e1cticas para el an\u00e1lisis exploratorio de datos\" width=\"97\" height=\"97\" title=\"\"><\/p>\t\t\t\t\t\t\t\t<\/div>\n\t\t\t\t<\/div>\n\t\t\t\t\t<\/div>\n\t\t<\/div>\n\t\t\t\t\t<\/div>\n\t\t<\/section>\n\t\t\t\t<section class=\"elementor-section elementor-top-section elementor-element elementor-element-73d2f5c elementor-section-boxed elementor-section-height-default elementor-section-height-default\" data-id=\"73d2f5c\" data-element_type=\"section\" data-e-type=\"section\">\n\t\t\t\t\t\t<div class=\"elementor-container elementor-column-gap-default\">\n\t\t\t\t\t<div class=\"elementor-column elementor-col-100 elementor-top-column elementor-element elementor-element-0a3558c\" data-id=\"0a3558c\" data-element_type=\"column\" data-e-type=\"column\">\n\t\t\t<div class=\"elementor-widget-wrap elementor-element-populated\">\n\t\t\t\t\t\t<div class=\"elementor-element elementor-element-2de95aa elementor-widget elementor-widget-heading\" data-id=\"2de95aa\" data-element_type=\"widget\" data-e-type=\"widget\" data-widget_type=\"heading.default\">\n\t\t\t\t<div class=\"elementor-widget-container\">\n\t\t\t\t\t<div id=\"ez-toc-container\" class=\"ez-toc-v2_0_82_2 counter-hierarchy ez-toc-counter ez-toc-grey ez-toc-container-direction\">\n<div class=\"ez-toc-title-container\">\n<p class=\"ez-toc-title\" style=\"cursor:inherit\">Contenido<\/p>\n<span class=\"ez-toc-title-toggle\"><a href=\"#\" class=\"ez-toc-pull-right ez-toc-btn ez-toc-btn-xs ez-toc-btn-default ez-toc-toggle\" aria-label=\"Tabla de contenido alternativo\"><span class=\"ez-toc-js-icon-con\"><span class=\"\"><span class=\"eztoc-hide\" style=\"display:none;\">Palanca<\/span><span class=\"ez-toc-icon-toggle-span\"><svg style=\"fill: #999;color:#999\" xmlns=\"http:\/\/www.w3.org\/2000\/svg\" class=\"list-377408\" width=\"20px\" height=\"20px\" viewbox=\"0 0 24 24\" fill=\"none\"><path d=\"M6 6H4v2h2V6zm14 0H8v2h12V6zM4 11h2v2H4v-2zm16 0H8v2h12v-2zM4 16h2v2H4v-2zm16 0H8v2h12v-2z\" fill=\"currentColor\"><\/path><\/svg><svg style=\"fill: #999;color:#999\" class=\"arrow-unsorted-368013\" xmlns=\"http:\/\/www.w3.org\/2000\/svg\" width=\"10px\" height=\"10px\" viewbox=\"0 0 24 24\" version=\"1.2\" baseprofile=\"tiny\"><path d=\"M18.2 9.3l-6.2-6.3-6.2 6.3c-.2.2-.3.4-.3.7s.1.5.3.7c.2.2.4.3.7.3h11c.3 0 .5-.1.7-.3.2-.2.3-.5.3-.7s-.1-.5-.3-.7zM5.8 14.7l6.2 6.3 6.2-6.3c.2-.2.3-.5.3-.7s-.1-.5-.3-.7c-.2-.2-.4-.3-.7-.3h-11c-.3 0-.5.1-.7.3-.2.2-.3.5-.3.7s.1.5.3.7z\"\/><\/svg><\/span><\/span><\/span><\/a><\/span><\/div>\n<nav><ul class='ez-toc-list ez-toc-list-level-1' ><li class='ez-toc-page-1 ez-toc-heading-level-2'><a class=\"ez-toc-link ez-toc-heading-1\" href=\"https:\/\/complex-systems-ai.com\/es\/analisis-descriptivo\/buenas-practicas-para-analisis-exploratorio-de-datos\/#Conseils-et-bonnes-pratiques-de-lanalyse-exploratoire-des-donnees-EDA\" >Consejos y mejores pr\u00e1cticas para el an\u00e1lisis exploratorio de datos (EDA)<\/a><\/li><li class='ez-toc-page-1 ez-toc-heading-level-2'><a class=\"ez-toc-link ez-toc-heading-2\" href=\"https:\/\/complex-systems-ai.com\/es\/analisis-descriptivo\/buenas-practicas-para-analisis-exploratorio-de-datos\/#Description-des-valeurs-quantitatives\" >Descripci\u00f3n de los valores cuantitativos<\/a><\/li><li class='ez-toc-page-1 ez-toc-heading-level-2'><a class=\"ez-toc-link ez-toc-heading-3\" href=\"https:\/\/complex-systems-ai.com\/es\/analisis-descriptivo\/buenas-practicas-para-analisis-exploratorio-de-datos\/#Selection-des-colonnes\" >Selecci\u00f3n de columnas<\/a><\/li><li class='ez-toc-page-1 ez-toc-heading-level-2'><a class=\"ez-toc-link ez-toc-heading-4\" href=\"https:\/\/complex-systems-ai.com\/es\/analisis-descriptivo\/buenas-practicas-para-analisis-exploratorio-de-datos\/#Donnees-qualitative\" >Datos cualitativos<\/a><\/li><\/ul><\/nav><\/div>\n<h2 class=\"elementor-heading-title elementor-size-default\"><span class=\"ez-toc-section\" id=\"Conseils-et-bonnes-pratiques-de-lanalyse-exploratoire-des-donnees-EDA\"><\/span>Consejos y mejores pr\u00e1cticas para el an\u00e1lisis exploratorio de datos (EDA)<span class=\"ez-toc-section-end\"><\/span><\/h2>\t\t\t\t<\/div>\n\t\t\t\t<\/div>\n\t\t\t\t\t<\/div>\n\t\t<\/div>\n\t\t\t\t\t<\/div>\n\t\t<\/section>\n\t\t\t\t<section class=\"elementor-section elementor-top-section elementor-element elementor-element-8c4f593 elementor-section-boxed elementor-section-height-default elementor-section-height-default\" data-id=\"8c4f593\" data-element_type=\"section\" data-e-type=\"section\">\n\t\t\t\t\t\t<div class=\"elementor-container elementor-column-gap-default\">\n\t\t\t\t\t<div class=\"elementor-column elementor-col-100 elementor-top-column elementor-element elementor-element-291f373\" data-id=\"291f373\" data-element_type=\"column\" data-e-type=\"column\">\n\t\t\t<div class=\"elementor-widget-wrap elementor-element-populated\">\n\t\t\t\t\t\t<div class=\"elementor-element elementor-element-42b04dc elementor-widget elementor-widget-text-editor\" data-id=\"42b04dc\" data-element_type=\"widget\" data-e-type=\"widget\" data-widget_type=\"text-editor.default\">\n\t\t\t\t<div class=\"elementor-widget-container\">\n\t\t\t\t\t\t\t\t\t<p>El an\u00e1lisis exploratorio de datos se refiere al proceso cr\u00edtico de realizar investigaciones iniciales de datos para descubrir patrones, detectar anomal\u00edas, probar hip\u00f3tesis y verificar hip\u00f3tesis utilizando estad\u00edsticas de resumen y gr\u00e1ficos de representaciones.<\/p><p>Es una buena pr\u00e1ctica comprender los datos primero y tratar de obtener la mayor cantidad de informaci\u00f3n posible. EDA se trata de dar sentido a los datos disponibles, antes de ensuciarlos con ellos.<\/p><p>Tomar\u00e9 una variante blanca de ejemplo del conjunto de datos Wine Quality que est\u00e1 disponible en UCI Machine Learning Repository e intentar\u00e9 obtener la mayor cantidad de informaci\u00f3n del conjunto de datos usando EDA.<\/p><p>Para comenzar, import\u00e9 las bibliotecas necesarias (para este ejemplo, pandas, numpy, matplotlib y seaborn) y cargu\u00e9 el conjunto de datos.<\/p><p><img fetchpriority=\"high\" decoding=\"async\" class=\"aligncenter wp-image-15740 size-large\" src=\"https:\/\/complex-systems-ai.com\/wp-content\/uploads\/2022\/04\/1_8KJeO0SOlhyxlvXkjbvjlA-1024x226.png\" alt=\"\" width=\"1024\" height=\"226\" title=\"\" srcset=\"https:\/\/complex-systems-ai.com\/wp-content\/uploads\/2022\/04\/1_8KJeO0SOlhyxlvXkjbvjlA-1024x226.png 1024w, https:\/\/complex-systems-ai.com\/wp-content\/uploads\/2022\/04\/1_8KJeO0SOlhyxlvXkjbvjlA-300x66.png 300w, https:\/\/complex-systems-ai.com\/wp-content\/uploads\/2022\/04\/1_8KJeO0SOlhyxlvXkjbvjlA-768x169.png 768w, https:\/\/complex-systems-ai.com\/wp-content\/uploads\/2022\/04\/1_8KJeO0SOlhyxlvXkjbvjlA-18x4.png 18w, https:\/\/complex-systems-ai.com\/wp-content\/uploads\/2022\/04\/1_8KJeO0SOlhyxlvXkjbvjlA-600x132.png 600w, https:\/\/complex-systems-ai.com\/wp-content\/uploads\/2022\/04\/1_8KJeO0SOlhyxlvXkjbvjlA.png 1121w\" sizes=\"(max-width: 1024px) 100vw, 1024px\" \/><\/p><p>Descubr\u00ed el n\u00famero total de filas y columnas en el conjunto de datos usando &#039;.shape&#039;.<\/p><p>El conjunto de datos incluye 4898 observaciones y 12 caracter\u00edsticas. Una de las cuales es una variable dependiente y las otras 11 son variables independientes: caracter\u00edsticas f\u00edsico-qu\u00edmicas.<\/p><p>Tambi\u00e9n es una buena pr\u00e1ctica conocer las columnas y sus tipos de datos correspondientes, as\u00ed como determinar si contienen o no valores nulos.<\/p><p><img decoding=\"async\" class=\"aligncenter wp-image-15741 size-large\" src=\"https:\/\/complex-systems-ai.com\/wp-content\/uploads\/2022\/04\/1_7cSVoZ4OjozPG9vo-yjB-w-1024x322.png\" alt=\"\" width=\"1024\" height=\"322\" title=\"\" srcset=\"https:\/\/complex-systems-ai.com\/wp-content\/uploads\/2022\/04\/1_7cSVoZ4OjozPG9vo-yjB-w-1024x322.png 1024w, https:\/\/complex-systems-ai.com\/wp-content\/uploads\/2022\/04\/1_7cSVoZ4OjozPG9vo-yjB-w-300x94.png 300w, https:\/\/complex-systems-ai.com\/wp-content\/uploads\/2022\/04\/1_7cSVoZ4OjozPG9vo-yjB-w-768x242.png 768w, https:\/\/complex-systems-ai.com\/wp-content\/uploads\/2022\/04\/1_7cSVoZ4OjozPG9vo-yjB-w-18x6.png 18w, https:\/\/complex-systems-ai.com\/wp-content\/uploads\/2022\/04\/1_7cSVoZ4OjozPG9vo-yjB-w-600x189.png 600w, https:\/\/complex-systems-ai.com\/wp-content\/uploads\/2022\/04\/1_7cSVoZ4OjozPG9vo-yjB-w.png 1132w\" sizes=\"(max-width: 1024px) 100vw, 1024px\" \/><\/p><p>Los datos solo tienen valores flotantes y enteros. Ninguna columna variable tiene valores nulos o faltantes.<\/p>\t\t\t\t\t\t\t\t<\/div>\n\t\t\t\t<\/div>\n\t\t\t\t\t<\/div>\n\t\t<\/div>\n\t\t\t\t\t<\/div>\n\t\t<\/section>\n\t\t\t\t<section class=\"elementor-section elementor-top-section elementor-element elementor-element-e223078 elementor-section-boxed elementor-section-height-default elementor-section-height-default\" data-id=\"e223078\" data-element_type=\"section\" data-e-type=\"section\">\n\t\t\t\t\t\t<div class=\"elementor-container elementor-column-gap-default\">\n\t\t\t\t\t<div class=\"elementor-column elementor-col-100 elementor-top-column elementor-element elementor-element-cc77079\" data-id=\"cc77079\" data-element_type=\"column\" data-e-type=\"column\">\n\t\t\t<div class=\"elementor-widget-wrap elementor-element-populated\">\n\t\t\t\t\t\t<div class=\"elementor-element elementor-element-a558951 elementor-widget elementor-widget-heading\" data-id=\"a558951\" data-element_type=\"widget\" data-e-type=\"widget\" data-widget_type=\"heading.default\">\n\t\t\t\t<div class=\"elementor-widget-container\">\n\t\t\t\t\t<h2 class=\"elementor-heading-title elementor-size-default\"><span class=\"ez-toc-section\" id=\"Description-des-valeurs-quantitatives\"><\/span>Descripci\u00f3n de los valores cuantitativos<span class=\"ez-toc-section-end\"><\/span><\/h2>\t\t\t\t<\/div>\n\t\t\t\t<\/div>\n\t\t\t\t\t<\/div>\n\t\t<\/div>\n\t\t\t\t\t<\/div>\n\t\t<\/section>\n\t\t\t\t<section class=\"elementor-section elementor-top-section elementor-element elementor-element-25de581 elementor-section-boxed elementor-section-height-default elementor-section-height-default\" data-id=\"25de581\" data-element_type=\"section\" data-e-type=\"section\">\n\t\t\t\t\t\t<div class=\"elementor-container elementor-column-gap-default\">\n\t\t\t\t\t<div class=\"elementor-column elementor-col-100 elementor-top-column elementor-element elementor-element-5276eff\" data-id=\"5276eff\" data-element_type=\"column\" data-e-type=\"column\">\n\t\t\t<div class=\"elementor-widget-wrap elementor-element-populated\">\n\t\t\t\t\t\t<div class=\"elementor-element elementor-element-099020f elementor-widget elementor-widget-text-editor\" data-id=\"099020f\" data-element_type=\"widget\" data-e-type=\"widget\" data-widget_type=\"text-editor.default\">\n\t\t\t\t<div class=\"elementor-widget-container\">\n\t\t\t\t\t\t\t\t\t<p>La funci\u00f3n describe() en pandas es muy \u00fatil para obtener varias estad\u00edsticas de resumen. Esta funci\u00f3n devuelve el recuento, la media, la desviaci\u00f3n est\u00e1ndar, los valores m\u00ednimo y m\u00e1ximo y los cuantiles de los datos.<\/p><p><img loading=\"lazy\" decoding=\"async\" class=\"aligncenter wp-image-15742 size-large\" src=\"https:\/\/complex-systems-ai.com\/wp-content\/uploads\/2022\/04\/1_79E_z0OZsqFExkRHm_OM5w-1024x317.png\" alt=\"\" width=\"1024\" height=\"317\" title=\"\" srcset=\"https:\/\/complex-systems-ai.com\/wp-content\/uploads\/2022\/04\/1_79E_z0OZsqFExkRHm_OM5w-1024x317.png 1024w, https:\/\/complex-systems-ai.com\/wp-content\/uploads\/2022\/04\/1_79E_z0OZsqFExkRHm_OM5w-300x93.png 300w, https:\/\/complex-systems-ai.com\/wp-content\/uploads\/2022\/04\/1_79E_z0OZsqFExkRHm_OM5w-768x238.png 768w, https:\/\/complex-systems-ai.com\/wp-content\/uploads\/2022\/04\/1_79E_z0OZsqFExkRHm_OM5w-18x6.png 18w, https:\/\/complex-systems-ai.com\/wp-content\/uploads\/2022\/04\/1_79E_z0OZsqFExkRHm_OM5w-600x186.png 600w, https:\/\/complex-systems-ai.com\/wp-content\/uploads\/2022\/04\/1_79E_z0OZsqFExkRHm_OM5w.png 1146w\" sizes=\"(max-width: 1024px) 100vw, 1024px\" \/><\/p><p>Aqu\u00ed, como puede ver, el valor medio es inferior al valor de la mediana de cada columna, que est\u00e1 representado por 50 % (percentil 50) en la columna de \u00edndice. En particular, existe una gran diferencia entre el 75\u00ba %tile y los valores m\u00e1ximos de los predictores de &quot;az\u00facar residual&quot;, &quot;di\u00f3xido de azufre libre&quot;, &quot;di\u00f3xido de azufre total&quot;. Por lo tanto, las observaciones 1 y 2 sugieren que existen valores at\u00edpicos extremos en nuestro conjunto de datos.<\/p><p>Python tiene una biblioteca de visualizaci\u00f3n, Seaborn, que se basa en matplotlib. Proporciona gr\u00e1ficos estad\u00edsticos muy atractivos para realizar an\u00e1lisis univariados y multivariados.<\/p>\t\t\t\t\t\t\t\t<\/div>\n\t\t\t\t<\/div>\n\t\t\t\t\t<\/div>\n\t\t<\/div>\n\t\t\t\t\t<\/div>\n\t\t<\/section>\n\t\t\t\t<section class=\"elementor-section elementor-top-section elementor-element elementor-element-39e0e52 elementor-section-boxed elementor-section-height-default elementor-section-height-default\" data-id=\"39e0e52\" data-element_type=\"section\" data-e-type=\"section\">\n\t\t\t\t\t\t<div class=\"elementor-container elementor-column-gap-default\">\n\t\t\t\t\t<div class=\"elementor-column elementor-col-100 elementor-top-column elementor-element elementor-element-3c31eab\" data-id=\"3c31eab\" data-element_type=\"column\" data-e-type=\"column\">\n\t\t\t<div class=\"elementor-widget-wrap elementor-element-populated\">\n\t\t\t\t\t\t<div class=\"elementor-element elementor-element-f6d2b7e elementor-widget elementor-widget-heading\" data-id=\"f6d2b7e\" data-element_type=\"widget\" data-e-type=\"widget\" data-widget_type=\"heading.default\">\n\t\t\t\t<div class=\"elementor-widget-container\">\n\t\t\t\t\t<h2 class=\"elementor-heading-title elementor-size-default\"><span class=\"ez-toc-section\" id=\"Selection-des-colonnes\"><\/span>Selecci\u00f3n de columnas<span class=\"ez-toc-section-end\"><\/span><\/h2>\t\t\t\t<\/div>\n\t\t\t\t<\/div>\n\t\t\t\t\t<\/div>\n\t\t<\/div>\n\t\t\t\t\t<\/div>\n\t\t<\/section>\n\t\t\t\t<section class=\"elementor-section elementor-top-section elementor-element elementor-element-5948054 elementor-section-boxed elementor-section-height-default elementor-section-height-default\" data-id=\"5948054\" data-element_type=\"section\" data-e-type=\"section\">\n\t\t\t\t\t\t<div class=\"elementor-container elementor-column-gap-default\">\n\t\t\t\t\t<div class=\"elementor-column elementor-col-100 elementor-top-column elementor-element elementor-element-724fd64\" data-id=\"724fd64\" data-element_type=\"column\" data-e-type=\"column\">\n\t\t\t<div class=\"elementor-widget-wrap elementor-element-populated\">\n\t\t\t\t\t\t<div class=\"elementor-element elementor-element-f6976fb elementor-widget elementor-widget-text-editor\" data-id=\"f6976fb\" data-element_type=\"widget\" data-e-type=\"widget\" data-widget_type=\"text-editor.default\">\n\t\t\t\t<div class=\"elementor-widget-container\">\n\t\t\t\t\t\t\t\t\t<p>Para utilizar los datos para el modelado, es necesario eliminar las variables correlacionadas para mejorar su modelo. Uno puede encontrar correlaciones usando la funci\u00f3n pandas &#039;.corr()&#039; y visualizar la matriz de <a href=\"https:\/\/complex-systems-ai.com\/es\/correlacion-y-regresiones\/\">correlaci\u00f3n<\/a> usando un mapa de calor en seaborn.<\/p><p><img loading=\"lazy\" decoding=\"async\" class=\"aligncenter wp-image-15745 size-large\" src=\"https:\/\/complex-systems-ai.com\/wp-content\/uploads\/2022\/04\/1_ObHerhSsFvFV6hLSgLMYHg-1024x709.jpeg\" alt=\"\" width=\"1024\" height=\"709\" title=\"\" srcset=\"https:\/\/complex-systems-ai.com\/wp-content\/uploads\/2022\/04\/1_ObHerhSsFvFV6hLSgLMYHg-1024x709.jpeg 1024w, https:\/\/complex-systems-ai.com\/wp-content\/uploads\/2022\/04\/1_ObHerhSsFvFV6hLSgLMYHg-300x208.jpeg 300w, https:\/\/complex-systems-ai.com\/wp-content\/uploads\/2022\/04\/1_ObHerhSsFvFV6hLSgLMYHg-768x532.jpeg 768w, https:\/\/complex-systems-ai.com\/wp-content\/uploads\/2022\/04\/1_ObHerhSsFvFV6hLSgLMYHg-18x12.jpeg 18w, https:\/\/complex-systems-ai.com\/wp-content\/uploads\/2022\/04\/1_ObHerhSsFvFV6hLSgLMYHg-600x416.jpeg 600w, https:\/\/complex-systems-ai.com\/wp-content\/uploads\/2022\/04\/1_ObHerhSsFvFV6hLSgLMYHg.jpeg 1400w\" sizes=\"(max-width: 1024px) 100vw, 1024px\" \/><\/p><p>Aqu\u00ed podemos deducir que &#039;densidad&#039; tiene una fuerte correlaci\u00f3n positiva con &#039;az\u00facar residual&#039; mientras que tiene una fuerte correlaci\u00f3n negativa con &#039;alcohol&#039;. El &quot;di\u00f3xido de azufre libre&quot; y el &quot;\u00e1cido c\u00edtrico&quot; casi no tienen correlaci\u00f3n con la &quot;calidad&quot;.<\/p><p>Dado que la correlaci\u00f3n es cero, podemos deducir que no existe una relaci\u00f3n lineal entre estos dos predictores. Sin embargo, es seguro eliminar estas funciones en caso de que aplique el modelo de <a href=\"https:\/\/complex-systems-ai.com\/es\/correlacion-y-regresiones\/transformacion-de-datos-y-regresion\/\">regresi\u00f3n<\/a> lineal al conjunto de datos.<\/p><p>Un diagrama de caja (o diagrama de caja) muestra la distribuci\u00f3n de datos cuantitativos de una manera que facilita las comparaciones entre variables. El cuadro muestra los cuartiles del conjunto de datos mientras que los bigotes se expanden para mostrar el resto de la distribuci\u00f3n.<\/p><p>En el diagrama de caja m\u00e1s simple, el rect\u00e1ngulo central se extiende desde el primer cuartil hasta el tercer cuartil (el rango intercuart\u00edlico o IQR). Un segmento dentro del rect\u00e1ngulo muestra la mediana, y los &quot;bigotes&quot; arriba y abajo del cuadro muestran las ubicaciones del m\u00ednimo y el m\u00e1ximo.<\/p><p><img loading=\"lazy\" decoding=\"async\" class=\"aligncenter wp-image-15746 size-large\" src=\"https:\/\/complex-systems-ai.com\/wp-content\/uploads\/2022\/04\/1_j1pIrOQDO9N8w27lXeTnGw-1024x401.jpeg\" alt=\"\" width=\"1024\" height=\"401\" title=\"\" srcset=\"https:\/\/complex-systems-ai.com\/wp-content\/uploads\/2022\/04\/1_j1pIrOQDO9N8w27lXeTnGw-1024x401.jpeg 1024w, https:\/\/complex-systems-ai.com\/wp-content\/uploads\/2022\/04\/1_j1pIrOQDO9N8w27lXeTnGw-300x117.jpeg 300w, https:\/\/complex-systems-ai.com\/wp-content\/uploads\/2022\/04\/1_j1pIrOQDO9N8w27lXeTnGw-768x301.jpeg 768w, https:\/\/complex-systems-ai.com\/wp-content\/uploads\/2022\/04\/1_j1pIrOQDO9N8w27lXeTnGw-18x7.jpeg 18w, https:\/\/complex-systems-ai.com\/wp-content\/uploads\/2022\/04\/1_j1pIrOQDO9N8w27lXeTnGw-600x235.jpeg 600w, https:\/\/complex-systems-ai.com\/wp-content\/uploads\/2022\/04\/1_j1pIrOQDO9N8w27lXeTnGw.jpeg 1400w\" sizes=\"(max-width: 1024px) 100vw, 1024px\" \/><\/p><p>Los valores at\u00edpicos son 3 \u00d7 IQR o m\u00e1s por encima del tercer cuartil o 3 \u00d7 IQR o m\u00e1s por debajo del primer cuartil. En nuestro conjunto de datos, a excepci\u00f3n de &quot;alcohol&quot;, todas las dem\u00e1s columnas de caracter\u00edsticas muestran valores at\u00edpicos.<\/p><p>Ahora, para verificar la linealidad de las variables, se recomienda trazar un gr\u00e1fico de distribuci\u00f3n y encontrar la asimetr\u00eda de las caracter\u00edsticas. La estimaci\u00f3n de densidad kernel (kde) es una herramienta muy \u00fatil para trazar la forma de una distribuci\u00f3n.<\/p><p><img loading=\"lazy\" decoding=\"async\" class=\"aligncenter wp-image-15747 size-large\" src=\"https:\/\/complex-systems-ai.com\/wp-content\/uploads\/2022\/04\/1_CrcsNnhKfN4pWgvAuO5pvQ-1024x190.jpeg\" alt=\"\" width=\"1024\" height=\"190\" title=\"\" srcset=\"https:\/\/complex-systems-ai.com\/wp-content\/uploads\/2022\/04\/1_CrcsNnhKfN4pWgvAuO5pvQ-1024x190.jpeg 1024w, https:\/\/complex-systems-ai.com\/wp-content\/uploads\/2022\/04\/1_CrcsNnhKfN4pWgvAuO5pvQ-300x56.jpeg 300w, https:\/\/complex-systems-ai.com\/wp-content\/uploads\/2022\/04\/1_CrcsNnhKfN4pWgvAuO5pvQ-768x143.jpeg 768w, https:\/\/complex-systems-ai.com\/wp-content\/uploads\/2022\/04\/1_CrcsNnhKfN4pWgvAuO5pvQ-18x3.jpeg 18w, https:\/\/complex-systems-ai.com\/wp-content\/uploads\/2022\/04\/1_CrcsNnhKfN4pWgvAuO5pvQ-600x111.jpeg 600w, https:\/\/complex-systems-ai.com\/wp-content\/uploads\/2022\/04\/1_CrcsNnhKfN4pWgvAuO5pvQ.jpeg 1400w\" sizes=\"(max-width: 1024px) 100vw, 1024px\" \/><\/p><p>La columna &quot;pH&quot; parece estar distribuida normalmente. Todas las variables independientes restantes tienen sesgo hacia la derecha\/sesgo positivo.<\/p>\t\t\t\t\t\t\t\t<\/div>\n\t\t\t\t<\/div>\n\t\t\t\t\t<\/div>\n\t\t<\/div>\n\t\t\t\t\t<\/div>\n\t\t<\/section>\n\t\t\t\t<section class=\"elementor-section elementor-top-section elementor-element elementor-element-bad09a2 elementor-section-boxed elementor-section-height-default elementor-section-height-default\" data-id=\"bad09a2\" data-element_type=\"section\" data-e-type=\"section\">\n\t\t\t\t\t\t<div class=\"elementor-container elementor-column-gap-default\">\n\t\t\t\t\t<div class=\"elementor-column elementor-col-100 elementor-top-column elementor-element elementor-element-f538cf1\" data-id=\"f538cf1\" data-element_type=\"column\" data-e-type=\"column\">\n\t\t\t<div class=\"elementor-widget-wrap elementor-element-populated\">\n\t\t\t\t\t\t<div class=\"elementor-element elementor-element-946c17b elementor-widget elementor-widget-heading\" data-id=\"946c17b\" data-element_type=\"widget\" data-e-type=\"widget\" data-widget_type=\"heading.default\">\n\t\t\t\t<div class=\"elementor-widget-container\">\n\t\t\t\t\t<h2 class=\"elementor-heading-title elementor-size-default\"><span class=\"ez-toc-section\" id=\"Donnees-qualitative\"><\/span>Datos cualitativos<span class=\"ez-toc-section-end\"><\/span><\/h2>\t\t\t\t<\/div>\n\t\t\t\t<\/div>\n\t\t\t\t\t<\/div>\n\t\t<\/div>\n\t\t\t\t\t<\/div>\n\t\t<\/section>\n\t\t\t\t<section class=\"elementor-section elementor-top-section elementor-element elementor-element-91d3d39 elementor-section-boxed elementor-section-height-default elementor-section-height-default\" data-id=\"91d3d39\" data-element_type=\"section\" data-e-type=\"section\">\n\t\t\t\t\t\t<div class=\"elementor-container elementor-column-gap-default\">\n\t\t\t\t\t<div class=\"elementor-column elementor-col-100 elementor-top-column elementor-element elementor-element-f082975\" data-id=\"f082975\" data-element_type=\"column\" data-e-type=\"column\">\n\t\t\t<div class=\"elementor-widget-wrap elementor-element-populated\">\n\t\t\t\t\t\t<div class=\"elementor-element elementor-element-877633c elementor-widget elementor-widget-text-editor\" data-id=\"877633c\" data-element_type=\"widget\" data-e-type=\"widget\" data-widget_type=\"text-editor.default\">\n\t\t\t\t<div class=\"elementor-widget-container\">\n\t\t\t\t\t\t\t\t\t<p>Para la exploraci\u00f3n de datos cualitativos, los invito a volver al glosario del curso de an\u00e1lisis descriptivo y elegir los Ejercicios correspondientes.<\/p>\t\t\t\t\t\t\t\t<\/div>\n\t\t\t\t<\/div>\n\t\t\t\t\t<\/div>\n\t\t<\/div>\n\t\t\t\t\t<\/div>\n\t\t<\/section>\n\t\t\t\t<\/div>","protected":false},"excerpt":{"rendered":"<p>An\u00e1lisis descriptivo P\u00e1gina de inicio de Wiki Esta p\u00e1gina describe buenas pr\u00e1cticas para el an\u00e1lisis exploratorio de datos: qu\u00e9 hacer con un conjunto de datos para... <\/p>","protected":false},"author":1,"featured_media":0,"parent":15506,"menu_order":0,"comment_status":"closed","ping_status":"closed","template":"","meta":{"footnotes":""},"class_list":["post-15734","page","type-page","status-publish","hentry"],"amp_enabled":true,"_links":{"self":[{"href":"https:\/\/complex-systems-ai.com\/es\/wp-json\/wp\/v2\/pages\/15734","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/complex-systems-ai.com\/es\/wp-json\/wp\/v2\/pages"}],"about":[{"href":"https:\/\/complex-systems-ai.com\/es\/wp-json\/wp\/v2\/types\/page"}],"author":[{"embeddable":true,"href":"https:\/\/complex-systems-ai.com\/es\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/complex-systems-ai.com\/es\/wp-json\/wp\/v2\/comments?post=15734"}],"version-history":[{"count":3,"href":"https:\/\/complex-systems-ai.com\/es\/wp-json\/wp\/v2\/pages\/15734\/revisions"}],"predecessor-version":[{"id":15753,"href":"https:\/\/complex-systems-ai.com\/es\/wp-json\/wp\/v2\/pages\/15734\/revisions\/15753"}],"up":[{"embeddable":true,"href":"https:\/\/complex-systems-ai.com\/es\/wp-json\/wp\/v2\/pages\/15506"}],"wp:attachment":[{"href":"https:\/\/complex-systems-ai.com\/es\/wp-json\/wp\/v2\/media?parent=15734"}],"curies":[{"name":"gracias","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}