{"id":16051,"date":"2022-05-04T18:27:34","date_gmt":"2022-05-04T17:27:34","guid":{"rendered":"https:\/\/complex-systems-ai.com\/?page_id=16051"},"modified":"2022-11-27T21:21:13","modified_gmt":"2022-11-27T20:21:13","slug":"metriques-pour-la-classification","status":"publish","type":"page","link":"https:\/\/complex-systems-ai.com\/es\/analisis-de-datos\/metricas-para-clasificacion\/","title":{"rendered":"M\u00e9tricas para la clasificaci\u00f3n"},"content":{"rendered":"<div data-elementor-type=\"wp-page\" data-elementor-id=\"16051\" class=\"elementor elementor-16051\">\n\t\t\t\t\t\t<section class=\"elementor-section elementor-top-section elementor-element elementor-element-973a3b9 elementor-section-boxed elementor-section-height-default elementor-section-height-default\" data-id=\"973a3b9\" data-element_type=\"section\" data-e-type=\"section\">\n\t\t\t\t\t\t<div class=\"elementor-container elementor-column-gap-default\">\n\t\t\t\t\t<div class=\"elementor-column elementor-col-33 elementor-top-column elementor-element elementor-element-f2e543e\" data-id=\"f2e543e\" data-element_type=\"column\" data-e-type=\"column\">\n\t\t\t<div class=\"elementor-widget-wrap elementor-element-populated\">\n\t\t\t\t\t\t<div class=\"elementor-element elementor-element-af0a155 elementor-align-justify elementor-widget elementor-widget-button\" data-id=\"af0a155\" data-element_type=\"widget\" data-e-type=\"widget\" data-widget_type=\"button.default\">\n\t\t\t\t<div class=\"elementor-widget-container\">\n\t\t\t\t\t\t\t\t\t<div class=\"elementor-button-wrapper\">\n\t\t\t\t\t<a class=\"elementor-button elementor-button-link elementor-size-sm\" href=\"https:\/\/complex-systems-ai.com\/es\/analisis-de-datos\/\">\n\t\t\t\t\t\t<span class=\"elementor-button-content-wrapper\">\n\t\t\t\t\t\t\t\t\t<span class=\"elementor-button-text\">An\u00e1lisis de datos<\/span>\n\t\t\t\t\t<\/span>\n\t\t\t\t\t<\/a>\n\t\t\t\t<\/div>\n\t\t\t\t\t\t\t\t<\/div>\n\t\t\t\t<\/div>\n\t\t\t\t\t<\/div>\n\t\t<\/div>\n\t\t\t\t<div class=\"elementor-column elementor-col-33 elementor-top-column elementor-element elementor-element-565f266\" data-id=\"565f266\" data-element_type=\"column\" data-e-type=\"column\">\n\t\t\t<div class=\"elementor-widget-wrap elementor-element-populated\">\n\t\t\t\t\t\t<div class=\"elementor-element elementor-element-f415f2a elementor-align-justify elementor-widget elementor-widget-button\" data-id=\"f415f2a\" data-element_type=\"widget\" data-e-type=\"widget\" data-widget_type=\"button.default\">\n\t\t\t\t<div class=\"elementor-widget-container\">\n\t\t\t\t\t\t\t\t\t<div class=\"elementor-button-wrapper\">\n\t\t\t\t\t<a class=\"elementor-button elementor-button-link elementor-size-sm\" href=\"https:\/\/complex-systems-ai.com\/es\/\">\n\t\t\t\t\t\t<span class=\"elementor-button-content-wrapper\">\n\t\t\t\t\t\t\t\t\t<span class=\"elementor-button-text\">Pagina de inicio<\/span>\n\t\t\t\t\t<\/span>\n\t\t\t\t\t<\/a>\n\t\t\t\t<\/div>\n\t\t\t\t\t\t\t\t<\/div>\n\t\t\t\t<\/div>\n\t\t\t\t\t<\/div>\n\t\t<\/div>\n\t\t\t\t<div class=\"elementor-column elementor-col-33 elementor-top-column elementor-element elementor-element-caf09ed\" data-id=\"caf09ed\" data-element_type=\"column\" data-e-type=\"column\">\n\t\t\t<div class=\"elementor-widget-wrap elementor-element-populated\">\n\t\t\t\t\t\t<div class=\"elementor-element elementor-element-f7eee87 elementor-align-justify elementor-widget elementor-widget-button\" data-id=\"f7eee87\" data-element_type=\"widget\" data-e-type=\"widget\" data-widget_type=\"button.default\">\n\t\t\t\t<div class=\"elementor-widget-container\">\n\t\t\t\t\t\t\t\t\t<div class=\"elementor-button-wrapper\">\n\t\t\t\t\t<a class=\"elementor-button elementor-button-link elementor-size-sm\" href=\"https:\/\/en.wikipedia.org\/wiki\/Data_analysis\" target=\"_blank\" rel=\"noopener\">\n\t\t\t\t\t\t<span class=\"elementor-button-content-wrapper\">\n\t\t\t\t\t\t\t\t\t<span class=\"elementor-button-text\">Wiki<\/span>\n\t\t\t\t\t<\/span>\n\t\t\t\t\t<\/a>\n\t\t\t\t<\/div>\n\t\t\t\t\t\t\t\t<\/div>\n\t\t\t\t<\/div>\n\t\t\t\t\t<\/div>\n\t\t<\/div>\n\t\t\t\t\t<\/div>\n\t\t<\/section>\n\t\t\t\t<section class=\"elementor-section elementor-top-section elementor-element elementor-element-d227945 elementor-section-boxed elementor-section-height-default elementor-section-height-default\" data-id=\"d227945\" data-element_type=\"section\" data-e-type=\"section\">\n\t\t\t\t\t\t<div class=\"elementor-container elementor-column-gap-default\">\n\t\t\t\t\t<div class=\"elementor-column elementor-col-100 elementor-top-column elementor-element elementor-element-bbfab2f\" data-id=\"bbfab2f\" data-element_type=\"column\" data-e-type=\"column\">\n\t\t\t<div class=\"elementor-widget-wrap elementor-element-populated\">\n\t\t\t\t\t\t<div class=\"elementor-element elementor-element-e96049c elementor-widget elementor-widget-text-editor\" data-id=\"e96049c\" data-element_type=\"widget\" data-e-type=\"widget\" data-widget_type=\"text-editor.default\">\n\t\t\t\t<div class=\"elementor-widget-container\">\n\t\t\t\t\t\t\t\t\t<p>Despu\u00e9s de realizar la exploraci\u00f3n, selecci\u00f3n y, por supuesto, implementaci\u00f3n de un modelo y obtener los resultados en forma de probabilidad o clase, el siguiente paso es determinar la efectividad del modelo en base a m\u00e9tricas para la clasificaci\u00f3n.<\/p><p><img decoding=\"async\" class=\"aligncenter wp-image-11096 size-full\" src=\"https:\/\/complex-systems-ai.com\/wp-content\/uploads\/2020\/09\/cropped-Capture.png\" alt=\"m\u00e9tricas para la clasificaci\u00f3n\" width=\"97\" height=\"97\" title=\"\"><\/p>\t\t\t\t\t\t\t\t<\/div>\n\t\t\t\t<\/div>\n\t\t\t\t\t<\/div>\n\t\t<\/div>\n\t\t\t\t\t<\/div>\n\t\t<\/section>\n\t\t\t\t<section class=\"elementor-section elementor-top-section elementor-element elementor-element-c64d027 elementor-section-boxed elementor-section-height-default elementor-section-height-default\" data-id=\"c64d027\" data-element_type=\"section\" data-e-type=\"section\">\n\t\t\t\t\t\t<div class=\"elementor-container elementor-column-gap-default\">\n\t\t\t\t\t<div class=\"elementor-column elementor-col-100 elementor-top-column elementor-element elementor-element-79a93a9\" data-id=\"79a93a9\" data-element_type=\"column\" data-e-type=\"column\">\n\t\t\t<div class=\"elementor-widget-wrap elementor-element-populated\">\n\t\t\t\t\t\t<div class=\"elementor-element elementor-element-a04b783 elementor-widget elementor-widget-heading\" data-id=\"a04b783\" data-element_type=\"widget\" data-e-type=\"widget\" data-widget_type=\"heading.default\">\n\t\t\t\t<div class=\"elementor-widget-container\">\n\t\t\t\t\t<div id=\"ez-toc-container\" class=\"ez-toc-v2_0_82_2 counter-hierarchy ez-toc-counter ez-toc-grey ez-toc-container-direction\">\n<div class=\"ez-toc-title-container\">\n<p class=\"ez-toc-title\" style=\"cursor:inherit\">Contenido<\/p>\n<span class=\"ez-toc-title-toggle\"><a href=\"#\" class=\"ez-toc-pull-right ez-toc-btn ez-toc-btn-xs ez-toc-btn-default ez-toc-toggle\" aria-label=\"Tabla de contenido alternativo\"><span class=\"ez-toc-js-icon-con\"><span class=\"\"><span class=\"eztoc-hide\" style=\"display:none;\">Palanca<\/span><span class=\"ez-toc-icon-toggle-span\"><svg style=\"fill: #999;color:#999\" xmlns=\"http:\/\/www.w3.org\/2000\/svg\" class=\"list-377408\" width=\"20px\" height=\"20px\" viewbox=\"0 0 24 24\" fill=\"none\"><path d=\"M6 6H4v2h2V6zm14 0H8v2h12V6zM4 11h2v2H4v-2zm16 0H8v2h12v-2zM4 16h2v2H4v-2zm16 0H8v2h12v-2z\" fill=\"currentColor\"><\/path><\/svg><svg style=\"fill: #999;color:#999\" class=\"arrow-unsorted-368013\" xmlns=\"http:\/\/www.w3.org\/2000\/svg\" width=\"10px\" height=\"10px\" viewbox=\"0 0 24 24\" version=\"1.2\" baseprofile=\"tiny\"><path d=\"M18.2 9.3l-6.2-6.3-6.2 6.3c-.2.2-.3.4-.3.7s.1.5.3.7c.2.2.4.3.7.3h11c.3 0 .5-.1.7-.3.2-.2.3-.5.3-.7s-.1-.5-.3-.7zM5.8 14.7l6.2 6.3 6.2-6.3c.2-.2.3-.5.3-.7s-.1-.5-.3-.7c-.2-.2-.4-.3-.7-.3h-11c-.3 0-.5.1-.7.3-.2.2-.3.5-.3.7s.1.5.3.7z\"\/><\/svg><\/span><\/span><\/span><\/a><\/span><\/div>\n<nav><ul class='ez-toc-list ez-toc-list-level-1' ><li class='ez-toc-page-1 ez-toc-heading-level-2'><a class=\"ez-toc-link ez-toc-heading-1\" href=\"https:\/\/complex-systems-ai.com\/es\/analisis-de-datos\/metricas-para-clasificacion\/#Quelles-metriques-pour-la-classification\" >\u00bfQu\u00e9 m\u00e9tricas para la clasificaci\u00f3n?<\/a><\/li><li class='ez-toc-page-1 ez-toc-heading-level-2'><a class=\"ez-toc-link ez-toc-heading-2\" href=\"https:\/\/complex-systems-ai.com\/es\/analisis-de-datos\/metricas-para-clasificacion\/#Matrice-de-confusion-confusion-matrix\" >Matriz de confusi\u00f3n<\/a><ul class='ez-toc-list-level-3' ><li class='ez-toc-heading-level-3'><a class=\"ez-toc-link ez-toc-heading-3\" href=\"https:\/\/complex-systems-ai.com\/es\/analisis-de-datos\/metricas-para-clasificacion\/#Minimiser-les-faux-negatifs\" >Minimizar los falsos negativos<\/a><\/li><li class='ez-toc-page-1 ez-toc-heading-level-3'><a class=\"ez-toc-link ez-toc-heading-4\" href=\"https:\/\/complex-systems-ai.com\/es\/analisis-de-datos\/metricas-para-clasificacion\/#Minimiser-les-faux-positifs\" >Minimizar los falsos positivos<\/a><\/li><\/ul><\/li><li class='ez-toc-page-1 ez-toc-heading-level-2'><a class=\"ez-toc-link ez-toc-heading-5\" href=\"https:\/\/complex-systems-ai.com\/es\/analisis-de-datos\/metricas-para-clasificacion\/#Exactitude-accuracy\" >Precisi\u00f3n<\/a><\/li><li class='ez-toc-page-1 ez-toc-heading-level-2'><a class=\"ez-toc-link ez-toc-heading-6\" href=\"https:\/\/complex-systems-ai.com\/es\/analisis-de-datos\/metricas-para-clasificacion\/#Precision-precision\" >Precisi\u00f3n (precisi\u00f3n)<\/a><\/li><li class='ez-toc-page-1 ez-toc-heading-level-2'><a class=\"ez-toc-link ez-toc-heading-7\" href=\"https:\/\/complex-systems-ai.com\/es\/analisis-de-datos\/metricas-para-clasificacion\/#Rappel-ou-sensibilite-Recall-Sensitivity\" >Recall o sensibilidad (Recall \/ Sensitivity)<\/a><\/li><li class='ez-toc-page-1 ez-toc-heading-level-2'><a class=\"ez-toc-link ez-toc-heading-8\" href=\"https:\/\/complex-systems-ai.com\/es\/analisis-de-datos\/metricas-para-clasificacion\/#Specificite-specificity\" >especificidad<\/a><\/li><li class='ez-toc-page-1 ez-toc-heading-level-2'><a class=\"ez-toc-link ez-toc-heading-9\" href=\"https:\/\/complex-systems-ai.com\/es\/analisis-de-datos\/metricas-para-clasificacion\/#Score-F1-F1-score\" >Puntuaci\u00f3n F1 (puntuaci\u00f3n F1)<\/a><\/li><li class='ez-toc-page-1 ez-toc-heading-level-2'><a class=\"ez-toc-link ez-toc-heading-10\" href=\"https:\/\/complex-systems-ai.com\/es\/analisis-de-datos\/metricas-para-clasificacion\/#A-voir-au-prochain-cours\" >\u00a1Hasta la pr\u00f3xima lecci\u00f3n!<\/a><\/li><\/ul><\/nav><\/div>\n<h2 class=\"elementor-heading-title elementor-size-default\"><span class=\"ez-toc-section\" id=\"Quelles-metriques-pour-la-classification\"><\/span>\u00bfQu\u00e9 m\u00e9tricas para la clasificaci\u00f3n?<span class=\"ez-toc-section-end\"><\/span><\/h2>\t\t\t\t<\/div>\n\t\t\t\t<\/div>\n\t\t\t\t\t<\/div>\n\t\t<\/div>\n\t\t\t\t\t<\/div>\n\t\t<\/section>\n\t\t\t\t<section class=\"elementor-section elementor-top-section elementor-element elementor-element-bf41e7e elementor-section-boxed elementor-section-height-default elementor-section-height-default\" data-id=\"bf41e7e\" data-element_type=\"section\" data-e-type=\"section\">\n\t\t\t\t\t\t<div class=\"elementor-container elementor-column-gap-default\">\n\t\t\t\t\t<div class=\"elementor-column elementor-col-100 elementor-top-column elementor-element elementor-element-3180dcc\" data-id=\"3180dcc\" data-element_type=\"column\" data-e-type=\"column\">\n\t\t\t<div class=\"elementor-widget-wrap elementor-element-populated\">\n\t\t\t\t\t\t<div class=\"elementor-element elementor-element-3abedf6 elementor-widget elementor-widget-text-editor\" data-id=\"3abedf6\" data-element_type=\"widget\" data-e-type=\"widget\" data-widget_type=\"text-editor.default\">\n\t\t\t\t<div class=\"elementor-widget-container\">\n\t\t\t\t\t\t\t\t\t<p>Podemos utilizar m\u00e9tricas de rendimiento de clasificaci\u00f3n como p\u00e9rdida de registro, precisi\u00f3n, AUC (\u00e1rea bajo la curva), etc. Otro ejemplo de una m\u00e9trica para evaluar los algoritmos de aprendizaje autom\u00e1tico es la precisi\u00f3n, el recuerdo, que se puede usar para ordenar los algoritmos que utilizan principalmente los motores de b\u00fasqueda.<\/p><p>Las m\u00e9tricas que elija para evaluar su modelo de aprendizaje autom\u00e1tico son muy importantes. La elecci\u00f3n de las m\u00e9tricas influye en c\u00f3mo se mide y compara el rendimiento de los algoritmos de aprendizaje autom\u00e1tico. Antes de perder m\u00e1s tiempo, entremos y veamos cu\u00e1les son esas m\u00e9tricas.<\/p>\t\t\t\t\t\t\t\t<\/div>\n\t\t\t\t<\/div>\n\t\t\t\t\t<\/div>\n\t\t<\/div>\n\t\t\t\t\t<\/div>\n\t\t<\/section>\n\t\t\t\t<section class=\"elementor-section elementor-top-section elementor-element elementor-element-038e3fd elementor-section-boxed elementor-section-height-default elementor-section-height-default\" data-id=\"038e3fd\" data-element_type=\"section\" data-e-type=\"section\">\n\t\t\t\t\t\t<div class=\"elementor-container elementor-column-gap-default\">\n\t\t\t\t\t<div class=\"elementor-column elementor-col-100 elementor-top-column elementor-element elementor-element-834681c\" data-id=\"834681c\" data-element_type=\"column\" data-e-type=\"column\">\n\t\t\t<div class=\"elementor-widget-wrap elementor-element-populated\">\n\t\t\t\t\t\t<div class=\"elementor-element elementor-element-7d7005f elementor-widget elementor-widget-heading\" data-id=\"7d7005f\" data-element_type=\"widget\" data-e-type=\"widget\" data-widget_type=\"heading.default\">\n\t\t\t\t<div class=\"elementor-widget-container\">\n\t\t\t\t\t<h2 class=\"elementor-heading-title elementor-size-default\"><span class=\"ez-toc-section\" id=\"Matrice-de-confusion-confusion-matrix\"><\/span>Matriz de confusi\u00f3n<span class=\"ez-toc-section-end\"><\/span><\/h2>\t\t\t\t<\/div>\n\t\t\t\t<\/div>\n\t\t\t\t\t<\/div>\n\t\t<\/div>\n\t\t\t\t\t<\/div>\n\t\t<\/section>\n\t\t\t\t<section class=\"elementor-section elementor-top-section elementor-element elementor-element-7027160 elementor-section-boxed elementor-section-height-default elementor-section-height-default\" data-id=\"7027160\" data-element_type=\"section\" data-e-type=\"section\">\n\t\t\t\t\t\t<div class=\"elementor-container elementor-column-gap-default\">\n\t\t\t\t\t<div class=\"elementor-column elementor-col-100 elementor-top-column elementor-element elementor-element-a296edb\" data-id=\"a296edb\" data-element_type=\"column\" data-e-type=\"column\">\n\t\t\t<div class=\"elementor-widget-wrap elementor-element-populated\">\n\t\t\t\t\t\t<div class=\"elementor-element elementor-element-e63a526 elementor-widget elementor-widget-text-editor\" data-id=\"e63a526\" data-element_type=\"widget\" data-e-type=\"widget\" data-widget_type=\"text-editor.default\">\n\t\t\t\t<div class=\"elementor-widget-container\">\n\t\t\t\t\t\t\t\t\t<p>La matriz de confusi\u00f3n es una de las medidas m\u00e1s intuitivas y sencillas (a menos, por supuesto, que no est\u00e9 confundido) que se utiliza para determinar la exactitud y precisi\u00f3n del modelo. Se utiliza para problemas de clasificaci\u00f3n en los que la salida puede ser de dos o m\u00e1s tipos de clase.<\/p><p>Antes de sumergirnos en lo que es la matriz de confusi\u00f3n y lo que transmite, digamos que estamos resolviendo un problema de clasificaci\u00f3n donde estamos prediciendo si una persona tiene c\u00e1ncer o no.<\/p><p>D\u00e9mosle una etiqueta a nuestra variable objetivo:<br \/>1: Cuando una persona tiene c\u00e1ncer 0: Cuando una persona NO tiene c\u00e1ncer.<\/p><p>Ahora que hemos identificado el problema, la matriz de confusi\u00f3n es una matriz bidimensional (&quot;Actual&quot; y &quot;Predicha&quot;) y conjuntos de &quot;clases&quot; en ambas dimensiones. Nuestras clasificaciones reales son columnas y las previstas son filas.<\/p><p><img decoding=\"async\" class=\"aligncenter size-medium wp-image-16057\" src=\"https:\/\/complex-systems-ai.com\/wp-content\/uploads\/2022\/05\/1_0exdQRxrXQgIBZdPFIxbTw-300x153.png\" alt=\"\" width=\"300\" height=\"153\" title=\"\" srcset=\"https:\/\/complex-systems-ai.com\/wp-content\/uploads\/2022\/05\/1_0exdQRxrXQgIBZdPFIxbTw-300x153.png 300w, https:\/\/complex-systems-ai.com\/wp-content\/uploads\/2022\/05\/1_0exdQRxrXQgIBZdPFIxbTw-18x9.png 18w, https:\/\/complex-systems-ai.com\/wp-content\/uploads\/2022\/05\/1_0exdQRxrXQgIBZdPFIxbTw-600x306.png 600w, https:\/\/complex-systems-ai.com\/wp-content\/uploads\/2022\/05\/1_0exdQRxrXQgIBZdPFIxbTw.png 690w\" sizes=\"(max-width: 300px) 100vw, 300px\" \/><\/p><p>La matriz de confusi\u00f3n en s\u00ed misma no es una m\u00e9trica de rendimiento como tal, pero casi todas las m\u00e9tricas de rendimiento se basan en la matriz de confusi\u00f3n y los n\u00fameros que contiene.<\/p><p><strong>Verdaderos positivos (VP):<\/strong> los verdaderos positivos son casos en los que la clase real del punto de datos fue 1 (verdadero) y el valor predicho tambi\u00e9n es 1.<\/p><p id=\"5cdd\" class=\"pw-post-body-paragraph jp jq ii js b jt ju jv jw jx jy jz ka kw kc kd ke kx kg kh ki ky kk kl km kn ib gj\" data-selectable-paragraph=\"\">Ej: El caso en el que una persona realmente tiene c\u00e1ncer (1) y el modelo clasifica su caso como c\u00e1ncer (1) se encuentra dentro del Verdadero positivo.<\/p><p id=\"dc70\" class=\"pw-post-body-paragraph jp jq ii js b jt ju jv jw jx jy jz ka kw kc kd ke kx kg kh ki ky kk kl km kn ib gj\" data-selectable-paragraph=\"\"><strong>Verdaderos negativos (TN):<\/strong> los verdaderos negativos son casos en los que la clase real del punto de datos era 0 (falso) y el valor predicho tambi\u00e9n es 0.<\/p><p id=\"e307\" class=\"pw-post-body-paragraph jp jq ii js b jt ju jv jw jx jy jz ka kw kc kd ke kx kg kh ki ky kk kl km kn ib gj\" data-selectable-paragraph=\"\">Ej.: El caso en el que una persona NO tiene c\u00e1ncer y el modelo que clasifica su caso como Sin c\u00e1ncer cae dentro de los Verdaderos Negativos.<\/p><p id=\"9ecf\" class=\"pw-post-body-paragraph jp jq ii js b jt ju jv jw jx jy jz ka kw kc kd ke kx kg kh ki ky kk kl km kn ib gj\" data-selectable-paragraph=\"\"><strong>Falsos positivos (FP):<\/strong> los falsos positivos son casos en los que la clase real del punto de datos fue 0 (falso) y el valor predicho es 1 (verdadero). Falso porque el modelo predijo incorrectamente y positivo porque la clase predicha fue positiva.<\/p><p id=\"e320\" class=\"pw-post-body-paragraph jp jq ii js b jt ju jv jw jx jy jz ka kw kc kd ke kx kg kh ki ky kk kl km kn ib gj\" data-selectable-paragraph=\"\">Ej: Una persona que NO padece c\u00e1ncer y el modelo clasificando su caso como c\u00e1ncer reporta falsos positivos.<\/p><p id=\"8f5d\" class=\"pw-post-body-paragraph jp jq ii js b jt ju jv jw jx jy jz ka kw kc kd ke kx kg kh ki ky kk kl km kn ib gj\" data-selectable-paragraph=\"\"><strong>Falsos negativos (FN):<\/strong> los falsos negativos son casos en los que la clase real del punto de datos era 1 (verdadero) y el valor predicho es 0 (falso). Falso porque el modelo predijo incorrectamente y negativo porque la clase predicha fue negativa.<\/p><p id=\"e969\" class=\"pw-post-body-paragraph jp jq ii js b jt ju jv jw jx jy jz ka kw kc kd ke kx kg kh ki ky kk kl km kn ib gj\" data-selectable-paragraph=\"\">Ej: Una persona con c\u00e1ncer y el modelo clasificando su caso como libre de c\u00e1ncer reporta falsos negativos.<\/p><p id=\"3c01\" class=\"pw-post-body-paragraph jp jq ii js b jt ju jv jw jx jy jz ka kw kc kd ke kx kg kh ki ky kk kl km kn ib gj\" data-selectable-paragraph=\"\">El escenario ideal que todos queremos es que el modelo arroje 0 falsos positivos y 0 falsos negativos. Pero este no es el caso en la vida real porque ning\u00fan modelo NO ser\u00e1 exacto a 100% la mayor parte del tiempo.<\/p><p>Sabemos que habr\u00e1 un error asociado con cada modelo que usemos para predecir la verdadera clase de la variable objetivo. Esto dar\u00e1 como resultado falsos positivos y falsos negativos (es decir, el modelo clasifica las cosas incorrectamente en relaci\u00f3n con la clase real).<\/p><p>No existe una regla estricta y r\u00e1pida que diga lo que debe minimizarse en todas las situaciones. Solo depende de las necesidades del negocio y el contexto del problema que est\u00e1 tratando de resolver. En base a esto, es posible que queramos minimizar los falsos positivos o los falsos negativos.<\/p><h3 id=\"dca2\" class=\"pw-post-body-paragraph jp jq ii js b jt ju jv jw jx jy jz ka kw kc kd ke kx kg kh ki ky kk kl km kn ib gj\"><span class=\"ez-toc-section\" id=\"Minimiser-les-faux-negatifs\"><\/span>Minimizar los falsos negativos<span class=\"ez-toc-section-end\"><\/span><\/h3><p>Digamos que en nuestro ejemplo de problema de detecci\u00f3n de c\u00e1ncer, de 100 personas, solo 5 personas tienen c\u00e1ncer. En este caso, queremos clasificar correctamente a todos los pacientes con c\u00e1ncer porque incluso un modelo muy MALO (Predecir a todos como NO cancerosos) nos dar\u00e1 una precisi\u00f3n de 95 % (ser\u00e1 exacto).<\/p><p>Pero, para capturar todos los casos de c\u00e1ncer, podr\u00edamos terminar haciendo una clasificaci\u00f3n donde la persona que NO tiene c\u00e1ncer se clasifique como cancerosa. Esto podr\u00eda ser aceptable ya que es menos peligroso que NO identificar\/capturar a un paciente con c\u00e1ncer, ya que de todos modos enviaremos los casos de c\u00e1ncer para su revisi\u00f3n e informe adicionales. Pero perder a un paciente con c\u00e1ncer ser\u00e1 un gran error porque no se le realizar\u00e1n m\u00e1s ex\u00e1menes.<\/p><h3 id=\"6e15\" class=\"pw-post-body-paragraph jp jq ii js b jt ju jv jw jx jy jz ka kw kc kd ke kx kg kh ki ky kk kl km kn ib gj\"><span class=\"ez-toc-section\" id=\"Minimiser-les-faux-positifs\"><\/span>Minimizar los falsos positivos<span class=\"ez-toc-section-end\"><\/span><\/h3><p id=\"798e\" class=\"pw-post-body-paragraph jp jq ii js b jt ju jv jw jx jy jz ka kw kc kd ke kx kg kh ki ky kk kl km kn ib gj\" data-selectable-paragraph=\"\">Para una mejor comprensi\u00f3n de los falsos positivos, usemos un ejemplo diferente donde el modelo clasifica si un correo electr\u00f3nico es spam o no.<\/p><p id=\"ba56\" class=\"pw-post-body-paragraph jp jq ii js b jt ju jv jw jx jy jz ka kw kc kd ke kx kg kh ki ky kk kl km kn ib gj\" data-selectable-paragraph=\"\">Supongamos que est\u00e1 esperando un correo electr\u00f3nico importante, como una respuesta de un reclutador o una carta de admisi\u00f3n de una universidad. Etiquetemos la variable de destino y digamos 1: &quot;El correo electr\u00f3nico es spam&quot; y 0: &quot;El correo electr\u00f3nico no es spam&quot;.<\/p><p id=\"3f0a\" class=\"pw-post-body-paragraph jp jq ii js b jt ju jv jw jx jy jz ka kw kc kd ke kx kg kh ki ky kk kl km kn ib gj\" data-selectable-paragraph=\"\">Supongamos que el modelo clasifica ese correo electr\u00f3nico importante que est\u00e1 esperando desesperadamente como spam (caso de falso positivo). Ahora, en esta situaci\u00f3n, es bastante malo clasificar un spam como importante o no porque, en este caso, siempre podemos seguir adelante y eliminarlo manualmente y no es doloroso si sucede de vez en cuando. Por lo tanto, al clasificar el spam, es m\u00e1s importante minimizar los falsos positivos que los falsos negativos.<\/p>\t\t\t\t\t\t\t\t<\/div>\n\t\t\t\t<\/div>\n\t\t\t\t\t<\/div>\n\t\t<\/div>\n\t\t\t\t\t<\/div>\n\t\t<\/section>\n\t\t\t\t<section class=\"elementor-section elementor-top-section elementor-element elementor-element-a17d661 elementor-section-boxed elementor-section-height-default elementor-section-height-default\" data-id=\"a17d661\" data-element_type=\"section\" data-e-type=\"section\">\n\t\t\t\t\t\t<div class=\"elementor-container elementor-column-gap-default\">\n\t\t\t\t\t<div class=\"elementor-column elementor-col-100 elementor-top-column elementor-element elementor-element-df16068\" data-id=\"df16068\" data-element_type=\"column\" data-e-type=\"column\">\n\t\t\t<div class=\"elementor-widget-wrap elementor-element-populated\">\n\t\t\t\t\t\t<div class=\"elementor-element elementor-element-46a8647 elementor-widget elementor-widget-heading\" data-id=\"46a8647\" data-element_type=\"widget\" data-e-type=\"widget\" data-widget_type=\"heading.default\">\n\t\t\t\t<div class=\"elementor-widget-container\">\n\t\t\t\t\t<h2 class=\"elementor-heading-title elementor-size-default\"><span class=\"ez-toc-section\" id=\"Exactitude-accuracy\"><\/span>Precisi\u00f3n<span class=\"ez-toc-section-end\"><\/span><\/h2>\t\t\t\t<\/div>\n\t\t\t\t<\/div>\n\t\t\t\t\t<\/div>\n\t\t<\/div>\n\t\t\t\t\t<\/div>\n\t\t<\/section>\n\t\t\t\t<section class=\"elementor-section elementor-top-section elementor-element elementor-element-3db9841 elementor-section-boxed elementor-section-height-default elementor-section-height-default\" data-id=\"3db9841\" data-element_type=\"section\" data-e-type=\"section\">\n\t\t\t\t\t\t<div class=\"elementor-container elementor-column-gap-default\">\n\t\t\t\t\t<div class=\"elementor-column elementor-col-100 elementor-top-column elementor-element elementor-element-03a7b29\" data-id=\"03a7b29\" data-element_type=\"column\" data-e-type=\"column\">\n\t\t\t<div class=\"elementor-widget-wrap elementor-element-populated\">\n\t\t\t\t\t\t<div class=\"elementor-element elementor-element-d78395d elementor-widget elementor-widget-text-editor\" data-id=\"d78395d\" data-element_type=\"widget\" data-e-type=\"widget\" data-widget_type=\"text-editor.default\">\n\t\t\t\t<div class=\"elementor-widget-container\">\n\t\t\t\t\t\t\t\t\t<p>La precisi\u00f3n en los problemas de clasificaci\u00f3n es el n\u00famero de predicciones correctas realizadas por el modelo sobre todo tipo de predicciones realizadas.<\/p><p><img fetchpriority=\"high\" decoding=\"async\" src=\"https:\/\/complex-systems-ai.com\/wp-content\/uploads\/2022\/05\/1_5XuZ_86Rfce3qyLt7XMlhw.png\" alt=\"\" width=\"532\" height=\"327\" title=\"\"><\/p><p data-selectable-paragraph=\"\">En el numerador est\u00e1n nuestras predicciones correctas (verdaderos positivos y verdaderos negativos) (marcadas en rojo en la figura de arriba) y en el denominador est\u00e1n el tipo de todas las predicciones hechas por el algoritmo (tanto buenas como malas).<\/p><p data-selectable-paragraph=\"\">La precisi\u00f3n es una buena medida cuando las clases de variables objetivo en los datos est\u00e1n casi equilibradas.<\/p><p data-selectable-paragraph=\"\">Ej: 60 % de las clases en nuestros datos de imagen de frutas son manzanas y 40 % son naranjas.<\/p><p data-selectable-paragraph=\"\">Un modelo que predice si una nueva imagen es Apple o Orange, 97 veces % correctamente es una muy buena medida en este ejemplo.<\/p><p data-selectable-paragraph=\"\">La precisi\u00f3n NUNCA debe usarse como medida cuando las clases de variables objetivo en los datos constituyen la mayor\u00eda de una clase.<\/p><p data-selectable-paragraph=\"\">Ej: En nuestro ejemplo de detecci\u00f3n de c\u00e1ncer con 100 personas, solo 5 personas tienen c\u00e1ncer. Digamos que nuestro modelo es muy malo y predice que no todos los casos son de c\u00e1ncer. Al hacerlo, clasific\u00f3 correctamente a estos 95 pacientes sin c\u00e1ncer y 5 pacientes con c\u00e1ncer como no cancerosos. Ahora, aunque el modelo es terrible para predecir el c\u00e1ncer, la precisi\u00f3n de un modelo tan malo tambi\u00e9n es 95 %.<\/p>\t\t\t\t\t\t\t\t<\/div>\n\t\t\t\t<\/div>\n\t\t\t\t\t<\/div>\n\t\t<\/div>\n\t\t\t\t\t<\/div>\n\t\t<\/section>\n\t\t\t\t<section class=\"elementor-section elementor-top-section elementor-element elementor-element-ea662de elementor-section-boxed elementor-section-height-default elementor-section-height-default\" data-id=\"ea662de\" data-element_type=\"section\" data-e-type=\"section\">\n\t\t\t\t\t\t<div class=\"elementor-container elementor-column-gap-default\">\n\t\t\t\t\t<div class=\"elementor-column elementor-col-100 elementor-top-column elementor-element elementor-element-3c97b39\" data-id=\"3c97b39\" data-element_type=\"column\" data-e-type=\"column\">\n\t\t\t<div class=\"elementor-widget-wrap elementor-element-populated\">\n\t\t\t\t\t\t<div class=\"elementor-element elementor-element-071fd3a elementor-widget elementor-widget-heading\" data-id=\"071fd3a\" data-element_type=\"widget\" data-e-type=\"widget\" data-widget_type=\"heading.default\">\n\t\t\t\t<div class=\"elementor-widget-container\">\n\t\t\t\t\t<h2 class=\"elementor-heading-title elementor-size-default\"><span class=\"ez-toc-section\" id=\"Precision-precision\"><\/span>Precisi\u00f3n (precisi\u00f3n)<span class=\"ez-toc-section-end\"><\/span><\/h2>\t\t\t\t<\/div>\n\t\t\t\t<\/div>\n\t\t\t\t\t<\/div>\n\t\t<\/div>\n\t\t\t\t\t<\/div>\n\t\t<\/section>\n\t\t\t\t<section class=\"elementor-section elementor-top-section elementor-element elementor-element-411b73b elementor-section-boxed elementor-section-height-default elementor-section-height-default\" data-id=\"411b73b\" data-element_type=\"section\" data-e-type=\"section\">\n\t\t\t\t\t\t<div class=\"elementor-container elementor-column-gap-default\">\n\t\t\t\t\t<div class=\"elementor-column elementor-col-100 elementor-top-column elementor-element elementor-element-9e489c8\" data-id=\"9e489c8\" data-element_type=\"column\" data-e-type=\"column\">\n\t\t\t<div class=\"elementor-widget-wrap elementor-element-populated\">\n\t\t\t\t\t\t<div class=\"elementor-element elementor-element-dcf6900 elementor-widget elementor-widget-text-editor\" data-id=\"dcf6900\" data-element_type=\"widget\" data-e-type=\"widget\" data-widget_type=\"text-editor.default\">\n\t\t\t\t<div class=\"elementor-widget-container\">\n\t\t\t\t\t\t\t\t\t<p>Usemos la misma matriz de confusi\u00f3n que usamos anteriormente para nuestro ejemplo de detecci\u00f3n de c\u00e1ncer.<\/p><p><img loading=\"lazy\" decoding=\"async\" class=\"aligncenter size-medium wp-image-16059\" src=\"https:\/\/complex-systems-ai.com\/wp-content\/uploads\/2022\/05\/1_KhlD7Js9leo0B0zfsIfAIA-300x224.png\" alt=\"\" width=\"300\" height=\"224\" title=\"\" srcset=\"https:\/\/complex-systems-ai.com\/wp-content\/uploads\/2022\/05\/1_KhlD7Js9leo0B0zfsIfAIA-300x224.png 300w, https:\/\/complex-systems-ai.com\/wp-content\/uploads\/2022\/05\/1_KhlD7Js9leo0B0zfsIfAIA-16x12.png 16w, https:\/\/complex-systems-ai.com\/wp-content\/uploads\/2022\/05\/1_KhlD7Js9leo0B0zfsIfAIA.png 714w, https:\/\/complex-systems-ai.com\/wp-content\/uploads\/2022\/05\/1_KhlD7Js9leo0B0zfsIfAIA-600x449.png 600w\" sizes=\"(max-width: 300px) 100vw, 300px\" \/><\/p><p>La precisi\u00f3n es una medida que nos dice qu\u00e9 proporci\u00f3n de pacientes que hemos diagnosticado con c\u00e1ncer realmente ten\u00edan c\u00e1ncer. Los positivos pronosticados (las personas pronosticadas como cancerosas son TP y FP) y las personas que realmente tienen c\u00e1ncer son TP.<\/p><p>Ej: En nuestro ejemplo de c\u00e1ncer con 100 personas, solo 5 personas tienen c\u00e1ncer. Digamos que nuestro modelo es muy malo y predice todos los casos como el c\u00e1ncer. Como predecimos que todo el mundo tiene c\u00e1ncer, nuestro denominador (verdaderos positivos y falsos positivos) es 100 y el numerador de la persona con c\u00e1ncer y el modelo que predice su caso como c\u00e1ncer es 5. Entonces, en este ejemplo, podemos decir que la precisi\u00f3n de tal un modelo es 5 %.<\/p>\t\t\t\t\t\t\t\t<\/div>\n\t\t\t\t<\/div>\n\t\t\t\t\t<\/div>\n\t\t<\/div>\n\t\t\t\t\t<\/div>\n\t\t<\/section>\n\t\t\t\t<section class=\"elementor-section elementor-top-section elementor-element elementor-element-d1ed331 elementor-section-boxed elementor-section-height-default elementor-section-height-default\" data-id=\"d1ed331\" data-element_type=\"section\" data-e-type=\"section\">\n\t\t\t\t\t\t<div class=\"elementor-container elementor-column-gap-default\">\n\t\t\t\t\t<div class=\"elementor-column elementor-col-100 elementor-top-column elementor-element elementor-element-267f6c1\" data-id=\"267f6c1\" data-element_type=\"column\" data-e-type=\"column\">\n\t\t\t<div class=\"elementor-widget-wrap elementor-element-populated\">\n\t\t\t\t\t\t<div class=\"elementor-element elementor-element-0f8817f elementor-widget elementor-widget-heading\" data-id=\"0f8817f\" data-element_type=\"widget\" data-e-type=\"widget\" data-widget_type=\"heading.default\">\n\t\t\t\t<div class=\"elementor-widget-container\">\n\t\t\t\t\t<h2 class=\"elementor-heading-title elementor-size-default\"><span class=\"ez-toc-section\" id=\"Rappel-ou-sensibilite-Recall-Sensitivity\"><\/span>Recall o sensibilidad (Recall \/ Sensitivity)<span class=\"ez-toc-section-end\"><\/span><\/h2>\t\t\t\t<\/div>\n\t\t\t\t<\/div>\n\t\t\t\t\t<\/div>\n\t\t<\/div>\n\t\t\t\t\t<\/div>\n\t\t<\/section>\n\t\t\t\t<section class=\"elementor-section elementor-top-section elementor-element elementor-element-a2d1e07 elementor-section-boxed elementor-section-height-default elementor-section-height-default\" data-id=\"a2d1e07\" data-element_type=\"section\" data-e-type=\"section\">\n\t\t\t\t\t\t<div class=\"elementor-container elementor-column-gap-default\">\n\t\t\t\t\t<div class=\"elementor-column elementor-col-100 elementor-top-column elementor-element elementor-element-47f6710\" data-id=\"47f6710\" data-element_type=\"column\" data-e-type=\"column\">\n\t\t\t<div class=\"elementor-widget-wrap elementor-element-populated\">\n\t\t\t\t\t\t<div class=\"elementor-element elementor-element-ed0d341 elementor-widget elementor-widget-text-editor\" data-id=\"ed0d341\" data-element_type=\"widget\" data-e-type=\"widget\" data-widget_type=\"text-editor.default\">\n\t\t\t\t<div class=\"elementor-widget-container\">\n\t\t\t\t\t\t\t\t\t<p>Recordar es una medida que nos dice qu\u00e9 proporci\u00f3n de pacientes que realmente ten\u00edan c\u00e1ncer fueron diagnosticados con c\u00e1ncer por el algoritmo. Los verdaderos positivos (las personas con c\u00e1ncer son TP y FN) y las personas diagnosticadas por el modelo con c\u00e1ncer son TP. (Nota: FN se incluye porque la persona realmente ten\u00eda c\u00e1ncer a pesar de que el modelo predijo lo contrario).<\/p><p><img loading=\"lazy\" decoding=\"async\" class=\"aligncenter size-medium wp-image-16060\" src=\"https:\/\/complex-systems-ai.com\/wp-content\/uploads\/2022\/05\/1_a8hkMGVHg3fl4kDmSIDY_A-300x192.png\" alt=\"\" width=\"300\" height=\"192\" title=\"\" srcset=\"https:\/\/complex-systems-ai.com\/wp-content\/uploads\/2022\/05\/1_a8hkMGVHg3fl4kDmSIDY_A-300x192.png 300w, https:\/\/complex-systems-ai.com\/wp-content\/uploads\/2022\/05\/1_a8hkMGVHg3fl4kDmSIDY_A-768x491.png 768w, https:\/\/complex-systems-ai.com\/wp-content\/uploads\/2022\/05\/1_a8hkMGVHg3fl4kDmSIDY_A-18x12.png 18w, https:\/\/complex-systems-ai.com\/wp-content\/uploads\/2022\/05\/1_a8hkMGVHg3fl4kDmSIDY_A-600x384.png 600w, https:\/\/complex-systems-ai.com\/wp-content\/uploads\/2022\/05\/1_a8hkMGVHg3fl4kDmSIDY_A.png 771w\" sizes=\"(max-width: 300px) 100vw, 300px\" \/><\/p><p id=\"f271\" class=\"pw-post-body-paragraph jp jq ii js b jt ju jv jw jx jy jz ka kw kc kd ke kx kg kh ki ky kk kl km kn ib gj\" data-selectable-paragraph=\"\">Ej: En nuestro ejemplo de c\u00e1ncer con 100 personas, 5 personas en realidad tienen c\u00e1ncer. Digamos que el modelo predice cada caso como c\u00e1ncer.<\/p><p id=\"03fd\" class=\"pw-post-body-paragraph jp jq ii js b jt ju jv jw jx jy jz ka kw kc kd ke kx kg kh ki ky kk kl km kn ib gj\" data-selectable-paragraph=\"\">Entonces nuestro denominador (verdaderos positivos y falsos negativos) es 5 y el numerador, la persona con c\u00e1ncer y el modelo que predice su caso como c\u00e1ncer tambi\u00e9n es 5 (ya que predijimos correctamente 5 casos de c\u00e1ncer). Entonces, en este ejemplo, podemos decir que la recuperaci\u00f3n de dicho patr\u00f3n es 100 %. Y la precisi\u00f3n de dicho modelo (como vimos arriba) es 5 %<\/p><p id=\"6443\" class=\"pw-post-body-paragraph jp jq ii js b jt ju jv jw jx jy jz ka kw kc kd ke kx kg kh ki ky kk kl km kn ib gj\" data-selectable-paragraph=\"\">Claramente, el recuerdo nos da informaci\u00f3n sobre el desempe\u00f1o de un clasificador con respecto a los falsos negativos (cu\u00e1ntos fallamos), mientras que la precisi\u00f3n nos brinda informaci\u00f3n sobre su desempe\u00f1o con respecto a los falsos positivos (cu\u00e1ntos atrapamos).<\/p><p id=\"627f\" class=\"pw-post-body-paragraph jp jq ii js b jt ju jv jw jx jy jz ka kw kc kd ke kx kg kh ki ky kk kl km kn ib gj\" data-selectable-paragraph=\"\">La precisi\u00f3n se trata de ser preciso. Entonces, incluso si logramos capturar un solo caso de c\u00e1ncer, y lo capturamos correctamente, tenemos una precisi\u00f3n de 100 %.<\/p><p id=\"7b95\" class=\"pw-post-body-paragraph jp jq ii js b jt ju jv jw jx jy jz ka kw kc kd ke kx kg kh ki ky kk kl km kn ib gj\" data-selectable-paragraph=\"\">El retiro no se trata tanto de capturar correctamente los casos, sino de capturar todos los casos que tienen &quot;c\u00e1ncer&quot; con la respuesta &quot;c\u00e1ncer&quot;. Entonces, si todav\u00eda etiquetamos cada caso como &quot;c\u00e1ncer&quot;, tenemos 100 % retirados.<\/p><p id=\"360f\" class=\"pw-post-body-paragraph jp jq ii js b jt ju jv jw jx jy jz ka kw kc kd ke kx kg kh ki ky kk kl km kn ib gj\" data-selectable-paragraph=\"\">B\u00e1sicamente, si queremos centrarnos m\u00e1s en el <a href=\"https:\/\/complex-systems-ai.com\/es\/teoria-del-lenguaje\/minimizacion-dun-afd\/\">minimizaci\u00f3n<\/a> falsos negativos, nos gustar\u00eda que nuestra recuperaci\u00f3n sea lo m\u00e1s cercana posible a 100 % sin que la precisi\u00f3n sea demasiado mala y si queremos centrarnos en minimizar los falsos positivos, nuestro objetivo debe ser hacer que la precisi\u00f3n sea lo m\u00e1s cercana posible a 100 %.<\/p>\t\t\t\t\t\t\t\t<\/div>\n\t\t\t\t<\/div>\n\t\t\t\t\t<\/div>\n\t\t<\/div>\n\t\t\t\t\t<\/div>\n\t\t<\/section>\n\t\t\t\t<section class=\"elementor-section elementor-top-section elementor-element elementor-element-ade5cc9 elementor-section-boxed elementor-section-height-default elementor-section-height-default\" data-id=\"ade5cc9\" data-element_type=\"section\" data-e-type=\"section\">\n\t\t\t\t\t\t<div class=\"elementor-container elementor-column-gap-default\">\n\t\t\t\t\t<div class=\"elementor-column elementor-col-100 elementor-top-column elementor-element elementor-element-1439d5a\" data-id=\"1439d5a\" data-element_type=\"column\" data-e-type=\"column\">\n\t\t\t<div class=\"elementor-widget-wrap elementor-element-populated\">\n\t\t\t\t\t\t<div class=\"elementor-element elementor-element-bf02c80 elementor-widget elementor-widget-heading\" data-id=\"bf02c80\" data-element_type=\"widget\" data-e-type=\"widget\" data-widget_type=\"heading.default\">\n\t\t\t\t<div class=\"elementor-widget-container\">\n\t\t\t\t\t<h2 class=\"elementor-heading-title elementor-size-default\"><span class=\"ez-toc-section\" id=\"Specificite-specificity\"><\/span>especificidad<span class=\"ez-toc-section-end\"><\/span><\/h2>\t\t\t\t<\/div>\n\t\t\t\t<\/div>\n\t\t\t\t\t<\/div>\n\t\t<\/div>\n\t\t\t\t\t<\/div>\n\t\t<\/section>\n\t\t\t\t<section class=\"elementor-section elementor-top-section elementor-element elementor-element-e511553 elementor-section-boxed elementor-section-height-default elementor-section-height-default\" data-id=\"e511553\" data-element_type=\"section\" data-e-type=\"section\">\n\t\t\t\t\t\t<div class=\"elementor-container elementor-column-gap-default\">\n\t\t\t\t\t<div class=\"elementor-column elementor-col-100 elementor-top-column elementor-element elementor-element-418ee2c\" data-id=\"418ee2c\" data-element_type=\"column\" data-e-type=\"column\">\n\t\t\t<div class=\"elementor-widget-wrap elementor-element-populated\">\n\t\t\t\t\t\t<div class=\"elementor-element elementor-element-e9c1169 elementor-widget elementor-widget-text-editor\" data-id=\"e9c1169\" data-element_type=\"widget\" data-e-type=\"widget\" data-widget_type=\"text-editor.default\">\n\t\t\t\t<div class=\"elementor-widget-container\">\n\t\t\t\t\t\t\t\t\t<p>La especificidad es una medida que nos dice qu\u00e9 proporci\u00f3n de pacientes que NO ten\u00edan c\u00e1ncer fueron predichos por el modelo como libres de c\u00e1ncer. Los verdaderos negativos (las personas que NO tienen c\u00e1ncer son FP y TN) y las personas que hemos diagnosticado que no tienen c\u00e1ncer son TN. (Nota: FP se incluye porque la persona en realidad NO ten\u00eda c\u00e1ncer, aunque el modelo predijera lo contrario). La especificidad es exactamente lo contrario de recordar.<\/p><p><img loading=\"lazy\" decoding=\"async\" class=\"aligncenter size-medium wp-image-16061\" src=\"https:\/\/complex-systems-ai.com\/wp-content\/uploads\/2022\/05\/1_deegiX75imQsVXYVpG_SDQ-300x256.png\" alt=\"\" width=\"300\" height=\"256\" title=\"\" srcset=\"https:\/\/complex-systems-ai.com\/wp-content\/uploads\/2022\/05\/1_deegiX75imQsVXYVpG_SDQ-300x256.png 300w, https:\/\/complex-systems-ai.com\/wp-content\/uploads\/2022\/05\/1_deegiX75imQsVXYVpG_SDQ-14x12.png 14w, https:\/\/complex-systems-ai.com\/wp-content\/uploads\/2022\/05\/1_deegiX75imQsVXYVpG_SDQ.png 424w\" sizes=\"(max-width: 300px) 100vw, 300px\" \/><\/p><p>Ej: En nuestro ejemplo de c\u00e1ncer con 100 personas, 5 personas en realidad tienen c\u00e1ncer. Digamos que el modelo predice cada caso como c\u00e1ncer.<\/p><p>As\u00ed que nuestro denominador (falsos positivos y verdaderos negativos) es 95 y el numerador, persona sin c\u00e1ncer y el modelo que predice su caso como sin c\u00e1ncer es 0 (ya que predijimos cada caso como c\u00e1ncer). Entonces, en este ejemplo, podemos decir que la especificidad de dicho patr\u00f3n es 0 %.<\/p>\t\t\t\t\t\t\t\t<\/div>\n\t\t\t\t<\/div>\n\t\t\t\t\t<\/div>\n\t\t<\/div>\n\t\t\t\t\t<\/div>\n\t\t<\/section>\n\t\t\t\t<section class=\"elementor-section elementor-top-section elementor-element elementor-element-c8a90ef elementor-section-boxed elementor-section-height-default elementor-section-height-default\" data-id=\"c8a90ef\" data-element_type=\"section\" data-e-type=\"section\">\n\t\t\t\t\t\t<div class=\"elementor-container elementor-column-gap-default\">\n\t\t\t\t\t<div class=\"elementor-column elementor-col-100 elementor-top-column elementor-element elementor-element-4c8f229\" data-id=\"4c8f229\" data-element_type=\"column\" data-e-type=\"column\">\n\t\t\t<div class=\"elementor-widget-wrap elementor-element-populated\">\n\t\t\t\t\t\t<div class=\"elementor-element elementor-element-1d8d093 elementor-widget elementor-widget-heading\" data-id=\"1d8d093\" data-element_type=\"widget\" data-e-type=\"widget\" data-widget_type=\"heading.default\">\n\t\t\t\t<div class=\"elementor-widget-container\">\n\t\t\t\t\t<h2 class=\"elementor-heading-title elementor-size-default\"><span class=\"ez-toc-section\" id=\"Score-F1-F1-score\"><\/span>Puntuaci\u00f3n F1 (puntuaci\u00f3n F1)<span class=\"ez-toc-section-end\"><\/span><\/h2>\t\t\t\t<\/div>\n\t\t\t\t<\/div>\n\t\t\t\t\t<\/div>\n\t\t<\/div>\n\t\t\t\t\t<\/div>\n\t\t<\/section>\n\t\t\t\t<section class=\"elementor-section elementor-top-section elementor-element elementor-element-11f2208 elementor-section-boxed elementor-section-height-default elementor-section-height-default\" data-id=\"11f2208\" data-element_type=\"section\" data-e-type=\"section\">\n\t\t\t\t\t\t<div class=\"elementor-container elementor-column-gap-default\">\n\t\t\t\t\t<div class=\"elementor-column elementor-col-100 elementor-top-column elementor-element elementor-element-59fbbc0\" data-id=\"59fbbc0\" data-element_type=\"column\" data-e-type=\"column\">\n\t\t\t<div class=\"elementor-widget-wrap elementor-element-populated\">\n\t\t\t\t\t\t<div class=\"elementor-element elementor-element-04df5a9 elementor-widget elementor-widget-text-editor\" data-id=\"04df5a9\" data-element_type=\"widget\" data-e-type=\"widget\" data-widget_type=\"text-editor.default\">\n\t\t\t\t<div class=\"elementor-widget-container\">\n\t\t\t\t\t\t\t\t\t<p>Realmente no queremos llevar Precision y Recall en nuestros bolsillos cada vez que construimos un modelo para resolver un problema de clasificaci\u00f3n. Por tanto, es preferible obtener una \u00fanica puntuaci\u00f3n que represente tanto la precisi\u00f3n (P) como la recuperaci\u00f3n (R).<\/p><p>Una forma de hacer esto es simplemente tomar su media aritm\u00e9tica. es decir, (P+R)\/2 donde P es Precisi\u00f3n y R es Recuperaci\u00f3n. Pero es bastante malo en algunas situaciones.<\/p><p>Supongamos que tenemos 100 transacciones con tarjeta de cr\u00e9dito, de las cuales 97 son leg\u00edtimas y 3 son fraudulentas y decimos que hemos encontrado un modelo que predice todo como fraude.<\/p><p>La precisi\u00f3n y recuperaci\u00f3n del ejemplo se muestra en la siguiente figura.<\/p><p><img loading=\"lazy\" decoding=\"async\" class=\"aligncenter wp-image-16062 size-full\" src=\"https:\/\/complex-systems-ai.com\/wp-content\/uploads\/2022\/05\/1_YjBz5UyU04AqDtS-EagBVw.png\" alt=\"\" width=\"627\" height=\"416\" title=\"\" srcset=\"https:\/\/complex-systems-ai.com\/wp-content\/uploads\/2022\/05\/1_YjBz5UyU04AqDtS-EagBVw.png 627w, https:\/\/complex-systems-ai.com\/wp-content\/uploads\/2022\/05\/1_YjBz5UyU04AqDtS-EagBVw-300x199.png 300w, https:\/\/complex-systems-ai.com\/wp-content\/uploads\/2022\/05\/1_YjBz5UyU04AqDtS-EagBVw-18x12.png 18w, https:\/\/complex-systems-ai.com\/wp-content\/uploads\/2022\/05\/1_YjBz5UyU04AqDtS-EagBVw-600x398.png 600w\" sizes=\"(max-width: 627px) 100vw, 627px\" \/><\/p><p>Ahora, si solo tomamos la media aritm\u00e9tica de los dos, resulta casi 51 %. No deber\u00edamos dar una calificaci\u00f3n tan moderada a un modelo terrible porque solo predice cada transacci\u00f3n como un fraude.<\/p><p>Entonces necesitamos algo m\u00e1s balanceado que la media aritm\u00e9tica y esa es la media arm\u00f3nica.<\/p><p><img loading=\"lazy\" decoding=\"async\" class=\"aligncenter wp-image-16063 size-full\" src=\"https:\/\/complex-systems-ai.com\/wp-content\/uploads\/2022\/05\/1_W2CxvU7m8R6cB_oz2U3ouA.png\" alt=\"\" width=\"314\" height=\"408\" title=\"\" srcset=\"https:\/\/complex-systems-ai.com\/wp-content\/uploads\/2022\/05\/1_W2CxvU7m8R6cB_oz2U3ouA.png 314w, https:\/\/complex-systems-ai.com\/wp-content\/uploads\/2022\/05\/1_W2CxvU7m8R6cB_oz2U3ouA-231x300.png 231w, https:\/\/complex-systems-ai.com\/wp-content\/uploads\/2022\/05\/1_W2CxvU7m8R6cB_oz2U3ouA-9x12.png 9w\" sizes=\"(max-width: 314px) 100vw, 314px\" \/><\/p><p>La media arm\u00f3nica viene dada por la f\u00f3rmula que se muestra en la figura de la izquierda.<\/p><p>La media arm\u00f3nica es un tipo de media cuando x e y son iguales. Pero cuando x e y son diferentes, entonces est\u00e1 m\u00e1s cerca del n\u00famero m\u00e1s peque\u00f1o que del n\u00famero m\u00e1s grande.<\/p><p>Para nuestro ejemplo anterior, Puntuaci\u00f3n F1 = Media arm\u00f3nica (Precisi\u00f3n, Recuperaci\u00f3n)<\/p><p>Puntuaci\u00f3n F1 = 2 * Precisi\u00f3n * Recuperaci\u00f3n \/ (Precisi\u00f3n + Recuperaci\u00f3n) = 2*3*100\/103 = 5%<\/p><p>Entonces, si un n\u00famero es realmente peque\u00f1o entre la precisi\u00f3n y la recuperaci\u00f3n, el puntaje F1 levanta una bandera y est\u00e1 m\u00e1s cerca del n\u00famero m\u00e1s peque\u00f1o que del m\u00e1s grande, lo que le da al modelo un puntaje apropiado en lugar de solo una media aritm\u00e9tica.<\/p>\t\t\t\t\t\t\t\t<\/div>\n\t\t\t\t<\/div>\n\t\t\t\t\t<\/div>\n\t\t<\/div>\n\t\t\t\t\t<\/div>\n\t\t<\/section>\n\t\t\t\t<section class=\"elementor-section elementor-top-section elementor-element elementor-element-d90b2fa elementor-section-boxed elementor-section-height-default elementor-section-height-default\" data-id=\"d90b2fa\" data-element_type=\"section\" data-e-type=\"section\">\n\t\t\t\t\t\t<div class=\"elementor-container elementor-column-gap-default\">\n\t\t\t\t\t<div class=\"elementor-column elementor-col-100 elementor-top-column elementor-element elementor-element-ffd0679\" data-id=\"ffd0679\" data-element_type=\"column\" data-e-type=\"column\">\n\t\t\t<div class=\"elementor-widget-wrap elementor-element-populated\">\n\t\t\t\t\t\t<div class=\"elementor-element elementor-element-ef57db9 elementor-widget elementor-widget-heading\" data-id=\"ef57db9\" data-element_type=\"widget\" data-e-type=\"widget\" data-widget_type=\"heading.default\">\n\t\t\t\t<div class=\"elementor-widget-container\">\n\t\t\t\t\t<h2 class=\"elementor-heading-title elementor-size-default\"><span class=\"ez-toc-section\" id=\"A-voir-au-prochain-cours\"><\/span>\u00a1Hasta la pr\u00f3xima lecci\u00f3n!<span class=\"ez-toc-section-end\"><\/span><\/h2>\t\t\t\t<\/div>\n\t\t\t\t<\/div>\n\t\t\t\t\t<\/div>\n\t\t<\/div>\n\t\t\t\t\t<\/div>\n\t\t<\/section>\n\t\t\t\t<section class=\"elementor-section elementor-top-section elementor-element elementor-element-ee228c4 elementor-section-boxed elementor-section-height-default elementor-section-height-default\" data-id=\"ee228c4\" data-element_type=\"section\" data-e-type=\"section\">\n\t\t\t\t\t\t<div class=\"elementor-container elementor-column-gap-default\">\n\t\t\t\t\t<div class=\"elementor-column elementor-col-100 elementor-top-column elementor-element elementor-element-ed24c35\" data-id=\"ed24c35\" data-element_type=\"column\" data-e-type=\"column\">\n\t\t\t<div class=\"elementor-widget-wrap elementor-element-populated\">\n\t\t\t\t\t\t<div class=\"elementor-element elementor-element-3b573a7 elementor-widget elementor-widget-text-editor\" data-id=\"3b573a7\" data-element_type=\"widget\" data-e-type=\"widget\" data-widget_type=\"text-editor.default\">\n\t\t\t\t<div class=\"elementor-widget-container\">\n\t\t\t\t\t\t\t\t\t<p>Hasta ahora hemos visto como m\u00e9tricas para la clasificaci\u00f3n qu\u00e9 es la matriz de confusi\u00f3n, qu\u00e9 es la exactitud, la precisi\u00f3n, el recuerdo (o sensibilidad), la especificidad y la puntuaci\u00f3n F1 para la clasificaci\u00f3n de un problema. En el pr\u00f3ximo art\u00edculo, otras medidas que se pueden usar como m\u00e9tricas para la clasificaci\u00f3n, como la curva AUC-ROC, la p\u00e9rdida de registro, la puntuaci\u00f3n F-Beta, etc.<\/p>\t\t\t\t\t\t\t\t<\/div>\n\t\t\t\t<\/div>\n\t\t\t\t\t<\/div>\n\t\t<\/div>\n\t\t\t\t\t<\/div>\n\t\t<\/section>\n\t\t\t\t<\/div>","protected":false},"excerpt":{"rendered":"<p>P\u00e1gina de inicio de Wiki de an\u00e1lisis de datos Despu\u00e9s de realizar la exploraci\u00f3n de datos, seleccionar y, por supuesto, implementar un modelo y obtener ... <\/p>","protected":false},"author":1,"featured_media":0,"parent":15503,"menu_order":0,"comment_status":"closed","ping_status":"closed","template":"","meta":{"footnotes":""},"class_list":["post-16051","page","type-page","status-publish","hentry"],"amp_enabled":true,"_links":{"self":[{"href":"https:\/\/complex-systems-ai.com\/es\/wp-json\/wp\/v2\/pages\/16051","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/complex-systems-ai.com\/es\/wp-json\/wp\/v2\/pages"}],"about":[{"href":"https:\/\/complex-systems-ai.com\/es\/wp-json\/wp\/v2\/types\/page"}],"author":[{"embeddable":true,"href":"https:\/\/complex-systems-ai.com\/es\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/complex-systems-ai.com\/es\/wp-json\/wp\/v2\/comments?post=16051"}],"version-history":[{"count":4,"href":"https:\/\/complex-systems-ai.com\/es\/wp-json\/wp\/v2\/pages\/16051\/revisions"}],"predecessor-version":[{"id":17895,"href":"https:\/\/complex-systems-ai.com\/es\/wp-json\/wp\/v2\/pages\/16051\/revisions\/17895"}],"up":[{"embeddable":true,"href":"https:\/\/complex-systems-ai.com\/es\/wp-json\/wp\/v2\/pages\/15503"}],"wp:attachment":[{"href":"https:\/\/complex-systems-ai.com\/es\/wp-json\/wp\/v2\/media?parent=16051"}],"curies":[{"name":"gracias","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}