{"id":1107,"date":"2024-10-27T08:05:52","date_gmt":"2024-10-27T08:05:52","guid":{"rendered":"https:\/\/wp.lancs.ac.uk\/newspainfleets\/?p=1107"},"modified":"2024-10-27T08:09:31","modified_gmt":"2024-10-27T08:09:31","slug":"explorando-los-modelos-de-lenguaje-extensos-y-su-impacto-en-las-humanidades","status":"publish","type":"post","link":"https:\/\/wp.lancs.ac.uk\/newspainfleets\/?p=1107","title":{"rendered":"Explorando los Modelos de Lenguaje Extensos y su Impacto en las Humanidades"},"content":{"rendered":"<p><span style=\"color: #999999\"><strong><span class=\"TextRun SCXW186879422 BCX0\" lang=\"ES-ES\" xml:lang=\"ES-ES\" data-contrast=\"auto\"><span class=\"NormalTextRun SCXW186879422 BCX0\">Patricia Murrieta-Flores<\/span><\/span><span class=\"EOP SCXW186879422 BCX0\" data-ccp-props=\"{}\"> <span class=\"NormalTextRun SpellingErrorV2Themed SCXW173072890 BCX0\">y Chat GPT<\/span><\/span><\/strong><\/span><\/p>\n<p>&nbsp;<\/p>\n<p><span style=\"color: #ff6600\"><strong>Introducci\u00f3n<\/strong><\/span><\/p>\n<p><span data-contrast=\"auto\">Hoy en d\u00eda, la Inteligencia Artificial (IA) ya no es solo cosa de ciencia ficci\u00f3n; es una realidad que est\u00e1 cambiando la forma en que interactuamos con la tecnolog\u00eda. Uno de los desarrollos m\u00e1s emocionantes en este campo son los Modelos de Lenguaje Extensos (Large Language Models, LLMs), como ChatGPT, que nos est\u00e1n ayudando a explorar nuevas formas de trabajar y aprender, especialmente en \u00e1reas como las Humanidades Digitales.<\/span><span data-ccp-props=\"{}\">\u00a0<\/span><\/p>\n<p>&nbsp;<\/p>\n<p><span style=\"color: #ff6600\"><b>\u00bfQu\u00e9 son los Modelos de Lenguaje Extensos?<\/b>\u00a0<\/span><\/p>\n<p><span data-contrast=\"auto\">Los LLMs son modelos de IA que han sido entrenados con cantidades enormes de texto para poder entender y generar lenguaje humano de manera sorprendentemente precisa. Estos modelos, como ChatGPT, est\u00e1n basados en redes neuronales y han recorrido un largo camino desde sus or\u00edgenes. Todo comenz\u00f3 en los a\u00f1os 50 con Alan Turing y su idea de que las m\u00e1quinas podr\u00edan pensar y, desde entonces, la tecnolog\u00eda ha avanzado hasta llegar a lo que conocemos hoy.<\/span><span data-ccp-props=\"{}\">\u00a0<\/span><\/p>\n<p><span data-contrast=\"auto\">En 2017, la introducci\u00f3n de los Transformers cambi\u00f3 las reglas del juego. Gracias a esta arquitectura, los modelos pueden procesar texto de manera m\u00e1s eficiente, capturando patrones y dependencias a largo plazo. Esto es lo que ha permitido que los modelos como GPT-4 sean capaces de generar texto tan coherente y relevante.<\/span><span data-ccp-props=\"{}\">\u00a0<\/span><\/p>\n<p>&nbsp;<\/p>\n<p><span style=\"color: #ff6600\"><b>\u00bfC\u00f3mo se aplican en las Humanidades Digitales?<\/b>\u00a0<\/span><\/p>\n<p><span data-contrast=\"auto\">Personalmente, he encontrado que estos modelos son herramientas poderosas para cualquier persona interesada en las Humanidades. Durante un taller reciente con nuestro equipo de investigaci\u00f3n, exploramos diferentes maneras en que los LLMs pueden ser \u00fatiles en este campo. Aqu\u00ed te comparto algunas de las aplicaciones m\u00e1s interesantes:<\/span><span data-ccp-props=\"{}\">\u00a0<\/span><\/p>\n<ul>\n<li data-leveltext=\"%1.\" data-font=\"\" data-listid=\"2\" data-list-defn-props=\"{&quot;335552541&quot;:0,&quot;335559685&quot;:720,&quot;335559991&quot;:360,&quot;469769242&quot;:[65533,0],&quot;469777803&quot;:&quot;left&quot;,&quot;469777804&quot;:&quot;%1.&quot;,&quot;469777815&quot;:&quot;multilevel&quot;}\" data-aria-posinset=\"1\" data-aria-level=\"1\"><b><span data-contrast=\"auto\">Extracci\u00f3n y Manipulaci\u00f3n de Datos<\/span><\/b><span data-contrast=\"auto\">: Una de las cosas que m\u00e1s me ha sorprendido es lo bien que estos modelos pueden ayudarnos a organizar y limpiar datos. Por ejemplo, es posible usar ChatGPT para extraer nombres de personas y lugares de documentos hist\u00f3ricos, y luego georreferenciarlos, d\u00e1ndonos coordenadas que podemos visualizar en un mapa.<\/span><span data-ccp-props=\"{}\">\u00a0<\/span><\/li>\n<\/ul>\n<ul>\n<li data-leveltext=\"%1.\" data-font=\"\" data-listid=\"2\" data-list-defn-props=\"{&quot;335552541&quot;:0,&quot;335559685&quot;:720,&quot;335559991&quot;:360,&quot;469769242&quot;:[65533,0],&quot;469777803&quot;:&quot;left&quot;,&quot;469777804&quot;:&quot;%1.&quot;,&quot;469777815&quot;:&quot;multilevel&quot;}\" data-aria-posinset=\"2\" data-aria-level=\"1\"><b><span data-contrast=\"auto\">An\u00e1lisis Textual<\/span><\/b><span data-contrast=\"auto\">: Si te dedicas a la investigaci\u00f3n, los LLMs pueden ser de gran utilidad y se pueden agregar a tus \u2018pipelines\u2019 de trabajo. Pueden resumir textos complejos, analizar literatura, e incluso generar preguntas de investigaci\u00f3n que quiz\u00e1 no se te hab\u00edan ocurrido. Todo esto de manera r\u00e1pida y eficiente, lo que te deja m\u00e1s tiempo para profundizar en lo que realmente importa.<\/span><span data-ccp-props=\"{}\">\u00a0<\/span><\/li>\n<\/ul>\n<ul>\n<li data-leveltext=\"%1.\" data-font=\"\" data-listid=\"2\" data-list-defn-props=\"{&quot;335552541&quot;:0,&quot;335559685&quot;:720,&quot;335559991&quot;:360,&quot;469769242&quot;:[65533,0],&quot;469777803&quot;:&quot;left&quot;,&quot;469777804&quot;:&quot;%1.&quot;,&quot;469777815&quot;:&quot;multilevel&quot;}\" data-aria-posinset=\"3\" data-aria-level=\"1\"><b><span data-contrast=\"auto\">Generaci\u00f3n de Contenido<\/span><\/b><span data-contrast=\"auto\">: Tambi\u00e9n se va volviendo cada vez m\u00e1s obvio que estos modelos son excelentes para crear contenido, ya sea para materiales educativos, ensayos o, incluso, para preparar discursos. Es como tener un asistente que te ayuda a pulir tus ideas y presentarlas de la mejor manera posible.<\/span><span data-ccp-props=\"{}\">\u00a0<\/span><\/li>\n<\/ul>\n<p>&nbsp;<\/p>\n<p><span style=\"color: #ff6600\"><b>Los desaf\u00edos \u00e9ticos que no podemos ignorar<\/b>\u00a0<\/span><\/p>\n<p><span data-contrast=\"auto\">Ahora, no todo es color de rosa. A pesar de lo \u00fatiles que son, los LLMs vienen con su propio conjunto de desaf\u00edos \u00e9ticos que debemos tener en cuenta. Uno de los principales problemas es la <\/span><b><span data-contrast=\"auto\">parcialidad<\/span><\/b><span data-contrast=\"auto\"> en los datos de entrenamiento. Estos modelos se entrenan con enormes cantidades de datos recopilados de internet, donde existen sesgos de todo tipo: raciales, de g\u00e9nero, culturales, y m\u00e1s. Debido a esto, los modelos pueden perpetuar e incluso amplificar estos sesgos cuando generan contenido. Por ejemplo, al responder preguntas o generar textos, pueden reforzar estereotipos o proporcionar informaci\u00f3n desequilibrada. Este problema es complejo de resolver porque est\u00e1 profundamente arraigado en los datos con los que los modelos son entrenados. Diversos estudios sugieren que, aunque hay esfuerzos para mitigar estos sesgos, es casi imposible eliminarlos por completo. Es particularmente importante considerar que estas tecnolog\u00edas y modelos est\u00e1n concebidos y entrenados con datos modernos, especialmente en lenguas Europeas, y con las visiones del Norte Global. A medida que los LLMs se utilizan en aplicaciones sensibles, como la educaci\u00f3n o la justicia, este problema podr\u00eda tener consecuencias significativas si no se maneja adecuadamente. <\/span><span data-contrast=\"auto\">Lee m\u00e1s aqu\u00ed: <\/span><a href=\"https:\/\/firstmonday.org\/ojs\/index.php\/fm\/article\/view\/13346\"><span data-contrast=\"none\">Should ChatGPT be biased? Challenges and risks of bias in large language models | First Monday<\/span><\/a><span data-ccp-props=\"{}\">\u00a0<\/span><\/p>\n<p><span data-contrast=\"auto\">Otro tema importante es la falta de <\/span><b><span data-contrast=\"auto\">transparencia<\/span><\/b><span data-contrast=\"auto\"> en c\u00f3mo funcionan los LLMs. Estos modelos son a menudo descritos como &#8220;cajas negras&#8221; porque, aunque generan resultados impresionantes, es dif\u00edcil entender c\u00f3mo llegan a esas conclusiones. Esto plantea problemas, especialmente en aplicaciones cr\u00edticas donde la explicaci\u00f3n de una decisi\u00f3n es vital, como en diagn\u00f3sticos m\u00e9dicos o en sistemas de recomendaci\u00f3n financiera. Los usuarios y los reguladores necesitan confiar en que estos modelos no solo funcionan bien, sino que tambi\u00e9n son explicables y auditables. Algunos expertos proponen que para que los LLMs sean confiables debe haber mecanismos m\u00e1s claros para auditar y entender sus decisiones, lo que implica desarrollar nuevas t\u00e9cnicas y normativas para garantizar que las decisiones de los LLMs sean transparentes y responsables. Lee m\u00e1s aqu\u00ed: <\/span><a href=\"https:\/\/www.businessinsider.es\/casi-todas-ia-generativas-suspenden-transparencia-indice-1322396\"><span data-contrast=\"none\">Casi todas las IA generativas suspenden en transparencia en este \u00edndice (businessinsider.es)<\/span><\/a><span data-ccp-props=\"{}\">\u00a0<\/span><\/p>\n<p><span data-contrast=\"auto\">Otro problema importante es el <\/span><b><span data-contrast=\"auto\">impacto medioambiental<\/span><\/b><span data-contrast=\"auto\"> en el desarrollo de estas herramientas y que a menudo se pasa por alto en las discusiones sobre la IA generativa. Entrenar y operar LLMs requiere una cantidad masiva de poder computacional, lo que a su vez consume una gran cantidad de energ\u00eda. Por ejemplo, se ha estimado que el entrenamiento de un solo modelo de lenguaje extenso puede emitir tantas emisiones de carbono como las que generar\u00eda un autom\u00f3vil durante m\u00e1s de 700,000 millas de conducci\u00f3n<\/span><span data-contrast=\"auto\">\u200b<\/span><span data-contrast=\"auto\">.<\/span><span data-ccp-props=\"{}\">\u00a0<\/span><\/p>\n<p><span data-contrast=\"auto\">La huella de carbono asociada con la IA es preocupante porque estos modelos no solo requieren energ\u00eda para el entrenamiento, sino tambi\u00e9n para la inferencia, es decir, para generar respuestas cada vez que se utilizan. A medida que el uso de LLMs se expande, tambi\u00e9n lo hace su impacto ambiental, lo que plantea serias preguntas sobre la sostenibilidad de esta tecnolog\u00eda a largo plazo.<\/span><span data-ccp-props=\"{}\">\u00a0<\/span><\/p>\n<p><span data-contrast=\"auto\">La comunidad tecnol\u00f3gica est\u00e1 comenzando a explorar formas de mitigar estos impactos, como el desarrollo de algoritmos m\u00e1s eficientes y el uso de fuentes de energ\u00eda renovable para los centros de datos. Sin embargo, estos esfuerzos todav\u00eda est\u00e1n en sus primeras etapas, y es crucial que se aceleren para evitar que la IA contribuya de manera significativa al cambio clim\u00e1tico<\/span><span data-contrast=\"auto\">\u200b. Lee m\u00e1s aqu\u00ed: <\/span><a href=\"https:\/\/www.science.cl\/es\/ciencia\/2024\/El_impacto_ambiental_de_la_IA_ESP\/#:~:text=El%20impacto%20ambiental%20de%20la%20IA%20generativa%20va,contribuyentes%20a%20la%20huella%20ecol%C3%B3gica%20de%20la%20industria.\"><span data-contrast=\"none\">El impacto ambiental de la IA generativa: perspectivas de investigadores, reguladores y titanes de la industria. \u2013 Science<\/span><\/a><span data-ccp-props=\"{}\">\u00a0<\/span><\/p>\n<p><span data-contrast=\"auto\">Finalmente, la <\/span><b><span data-contrast=\"auto\">privacidad<\/span><\/b><span data-contrast=\"auto\"> es una gran preocupaci\u00f3n. Estos modelos dependen de grandes cantidades de datos personales para funcionar, y eso plantea preguntas sobre c\u00f3mo se protegen nuestros datos. Estos modelos suelen necesitar acceso a grandes cantidades de datos personales para funcionar eficazmente. Esto plantea riesgos significativos, como la posible exposici\u00f3n o mal uso de informaci\u00f3n sensible. Adem\u00e1s, dado que los LLMs pueden generar texto basado en los datos con los que fueron entrenados, existe el riesgo de que puedan divulgar inadvertidamente informaci\u00f3n confidencial.<\/span><span data-ccp-props=\"{}\">\u00a0<\/span><\/p>\n<p><span data-contrast=\"auto\">En un mundo donde la privacidad ya est\u00e1 siendo erosionada por el creciente uso de la tecnolog\u00eda, el despliegue masivo de LLMs podr\u00eda agravar estos problemas, haciendo a\u00fan m\u00e1s urgente la necesidad de regulaciones y salvaguardas que protejan los datos personales<\/span><span data-contrast=\"auto\">\u200b. Lee m\u00e1s aqu\u00ed: <\/span><a href=\"https:\/\/www.welivesecurity.com\/es\/privacidad\/inteligencia-artificial-limites-privacidad\/\"><span data-contrast=\"none\">La inteligencia artificial y los l\u00edmites de la privacidad (welivesecurity.com)<\/span><\/a><span data-ccp-props=\"{}\">\u00a0<\/span><\/p>\n<p>&nbsp;<\/p>\n<p><span style=\"color: #ff6600\"><b>Reflexiones Finales<\/b>\u00a0<\/span><\/p>\n<p><span data-contrast=\"auto\">La Inteligencia Artificial, y en particular los Modelos de Lenguaje Extensos, est\u00e1n transformando las Humanidades Digitales de maneras que nunca habr\u00edamos imaginado. Sin embargo, es crucial que sigamos cuestionando y discutiendo los desaf\u00edos \u00e9ticos que acompa\u00f1an a estas tecnolog\u00edas. Al final del d\u00eda, lo que realmente importa es que usemos estas herramientas de manera responsable para promover el bien com\u00fan, en nuestro caso, avanzar \u00e1mbitos de investigaci\u00f3n, pero al mismo tiempo siendo cr\u00edticos con las herramientas que desarrollamos e utilizamos.<\/span><span data-ccp-props=\"{}\">\u00a0<\/span><\/p>\n","protected":false},"excerpt":{"rendered":"<p>Patricia Murrieta-Flores y Chat GPT &nbsp; Introducci\u00f3n Hoy en d\u00eda, la Inteligencia Artificial (IA) ya no es solo cosa de ciencia ficci\u00f3n; es una realidad que est\u00e1 cambiando la forma en que interactuamos con la tecnolog\u00eda. Uno de los desarrollos m\u00e1s emocionantes en este campo son los Modelos de Lenguaje Extensos (Large Language Models, LLMs), [&hellip;]<\/p>\n","protected":false},"author":1853,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"site-sidebar-layout":"default","site-content-layout":"","ast-site-content-layout":"default","site-content-style":"default","site-sidebar-style":"default","ast-global-header-display":"","ast-banner-title-visibility":"","ast-main-header-display":"","ast-hfb-above-header-display":"","ast-hfb-below-header-display":"","ast-hfb-mobile-header-display":"","site-post-title":"","ast-breadcrumbs-content":"","ast-featured-img":"","footer-sml-layout":"","ast-disable-related-posts":"","theme-transparent-header-meta":"default","adv-header-id-meta":"","stick-header-meta":"","header-above-stick-meta":"","header-main-stick-meta":"","header-below-stick-meta":"","astra-migrate-meta-layouts":"set","ast-page-background-enabled":"default","ast-page-background-meta":{"desktop":{"background-color":"var(--ast-global-color-4)","background-image":"","background-repeat":"repeat","background-position":"center center","background-size":"auto","background-attachment":"scroll","background-type":"","background-media":"","overlay-type":"","overlay-color":"","overlay-opacity":"","overlay-gradient":""},"tablet":{"background-color":"","background-image":"","background-repeat":"repeat","background-position":"center center","background-size":"auto","background-attachment":"scroll","background-type":"","background-media":"","overlay-type":"","overlay-color":"","overlay-opacity":"","overlay-gradient":""},"mobile":{"background-color":"","background-image":"","background-repeat":"repeat","background-position":"center center","background-size":"auto","background-attachment":"scroll","background-type":"","background-media":"","overlay-type":"","overlay-color":"","overlay-opacity":"","overlay-gradient":""}},"ast-content-background-meta":{"desktop":{"background-color":"var(--ast-global-color-5)","background-image":"","background-repeat":"repeat","background-position":"center center","background-size":"auto","background-attachment":"scroll","background-type":"","background-media":"","overlay-type":"","overlay-color":"","overlay-opacity":"","overlay-gradient":""},"tablet":{"background-color":"var(--ast-global-color-5)","background-image":"","background-repeat":"repeat","background-position":"center center","background-size":"auto","background-attachment":"scroll","background-type":"","background-media":"","overlay-type":"","overlay-color":"","overlay-opacity":"","overlay-gradient":""},"mobile":{"background-color":"var(--ast-global-color-5)","background-image":"","background-repeat":"repeat","background-position":"center center","background-size":"auto","background-attachment":"scroll","background-type":"","background-media":"","overlay-type":"","overlay-color":"","overlay-opacity":"","overlay-gradient":""}},"footnotes":""},"categories":[1],"tags":[],"class_list":["post-1107","post","type-post","status-publish","format-standard","hentry","category-uncategorized-es"],"_links":{"self":[{"href":"https:\/\/wp.lancs.ac.uk\/newspainfleets\/index.php?rest_route=\/wp\/v2\/posts\/1107","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/wp.lancs.ac.uk\/newspainfleets\/index.php?rest_route=\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/wp.lancs.ac.uk\/newspainfleets\/index.php?rest_route=\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/wp.lancs.ac.uk\/newspainfleets\/index.php?rest_route=\/wp\/v2\/users\/1853"}],"replies":[{"embeddable":true,"href":"https:\/\/wp.lancs.ac.uk\/newspainfleets\/index.php?rest_route=%2Fwp%2Fv2%2Fcomments&post=1107"}],"version-history":[{"count":2,"href":"https:\/\/wp.lancs.ac.uk\/newspainfleets\/index.php?rest_route=\/wp\/v2\/posts\/1107\/revisions"}],"predecessor-version":[{"id":1110,"href":"https:\/\/wp.lancs.ac.uk\/newspainfleets\/index.php?rest_route=\/wp\/v2\/posts\/1107\/revisions\/1110"}],"wp:attachment":[{"href":"https:\/\/wp.lancs.ac.uk\/newspainfleets\/index.php?rest_route=%2Fwp%2Fv2%2Fmedia&parent=1107"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/wp.lancs.ac.uk\/newspainfleets\/index.php?rest_route=%2Fwp%2Fv2%2Fcategories&post=1107"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/wp.lancs.ac.uk\/newspainfleets\/index.php?rest_route=%2Fwp%2Fv2%2Ftags&post=1107"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}