{"id":1477,"date":"2019-03-06T11:18:36","date_gmt":"2019-03-06T14:18:36","guid":{"rendered":"https:\/\/icc.fcen.uba.ar\/?p=1477"},"modified":"2022-03-29T10:39:24","modified_gmt":"2022-03-29T13:39:24","slug":"conversando-con-las-computadoras","status":"publish","type":"post","link":"https:\/\/icc.fcen.uba.ar\/en\/conversando-con-las-computadoras\/","title":{"rendered":"Conversando con las computadoras"},"content":{"rendered":"<div class=\"fusion-fullwidth fullwidth-box fusion-builder-row-1 nonhundred-percent-fullwidth non-hundred-percent-height-scrolling\" style=\"--awb-border-radius-top-left:0px;--awb-border-radius-top-right:0px;--awb-border-radius-bottom-right:0px;--awb-border-radius-bottom-left:0px;--awb-flex-wrap:wrap;\" ><div class=\"fusion-builder-row fusion-row\"><div class=\"fusion-layout-column fusion_builder_column fusion-builder-column-0 fusion_builder_column_1_1 1_1 fusion-one-full fusion-column-first fusion-column-last\" style=\"--awb-bg-size:cover;--awb-margin-bottom:0px;\"><div class=\"fusion-column-wrapper fusion-flex-column-wrapper-legacy\"><div class=\"fusion-text fusion-text-1\"><p><em><strong>Actualmente el ICC cuenta con un \u00e1rea de Inteligencia Artificial que, entre muchos otros temas, trabaja espec\u00edficamente en el Procesamiento del Lenguaje Natural y del Habla. Tal es as\u00ed que uno de sus t\u00f3picos de investigaci\u00f3n son los sistemas de di\u00e1logo, que posibilitan una interacci\u00f3n entre el humano y la computadora a trav\u00e9s del habla. Algunos de los desaf\u00edos del \u00e1rea consisten en c\u00f3mo lograr darle naturalidad al di\u00e1logo con m\u00e9todos computacionales y, en particular, entender en mejor medida el fen\u00f3meno de mimetizaci\u00f3n, que es la tendencia de una persona a adaptarse a la forma de hablar de su interlocutor<\/strong><\/em><!--more--><\/p>\n<p>\u00bfPueden hablar las computadoras? La pregunta resuena permanentemente porque estamos habituados a que distintos sistemas logren, por medio del software, tareas que un ser humano puede hacer, desde jugar al ajedrez o al Go, o bien reconocer objetos con precisi\u00f3n. En el campo de la Inteligencia Artificial se intentan reproducir todas las funciones que definen a la inteligencia del ser humano, entre ellas, la complejidad del lenguaje oral. \u201c<em>Nuestra l\u00ednea principal de trabajo son los sistemas de di\u00e1logo hablado, cuyo ejemplo m\u00e1s actual son los asistentes virtuales<\/em>\u201d, puntualiza <strong>Agust\u00edn Gravano<\/strong>, investigador del ICC y profesor de Exactas-UBA.<\/p>\n<p><img decoding=\"async\" class=\"lazyload alignleft wp-image-1479\" src=\"https:\/\/icc.fcen.uba.ar\/wp-content\/uploads\/2019\/03\/voz-nota-gravano-600x367.jpg\" data-orig-src=\"https:\/\/icc.fcen.uba.ar\/wp-content\/uploads\/2019\/03\/voz-nota-gravano-600x367.jpg\" alt=\"\" width=\"324\" height=\"198\" srcset=\"data:image\/svg+xml,%3Csvg%20xmlns%3D%27http%3A%2F%2Fwww.w3.org%2F2000%2Fsvg%27%20width%3D%27324%27%20height%3D%27198%27%20viewBox%3D%270%200%20324%20198%27%3E%3Crect%20width%3D%27324%27%20height%3D%27198%27%20fill-opacity%3D%220%22%2F%3E%3C%2Fsvg%3E\" data-srcset=\"https:\/\/icc.fcen.uba.ar\/wp-content\/uploads\/2019\/03\/voz-nota-gravano-200x122.jpg 200w, https:\/\/icc.fcen.uba.ar\/wp-content\/uploads\/2019\/03\/voz-nota-gravano-300x184.jpg 300w, https:\/\/icc.fcen.uba.ar\/wp-content\/uploads\/2019\/03\/voz-nota-gravano-400x245.jpg 400w, https:\/\/icc.fcen.uba.ar\/wp-content\/uploads\/2019\/03\/voz-nota-gravano-600x367.jpg 600w, https:\/\/icc.fcen.uba.ar\/wp-content\/uploads\/2019\/03\/voz-nota-gravano.jpg 670w\" data-sizes=\"auto\" data-orig-sizes=\"(max-width: 324px) 100vw, 324px\" \/>Entre estos asistentes se encuentran Siri de Apple, Alexa de Amazon, Cortana de Microsoft, o Google Now en Google. Con todos ellos se puede hablar para pedirles cosas, desde poner m\u00fasica, pedir una receta de cocina o llamar al m\u00e9dico. Sin embargo, seg\u00fan comenta el investigador, estos sistemas de di\u00e1logo hablado funcionan mediante comandos: el usuario pide algo y la computadora contesta, no hay un \u201cida y vuelta\u201d tal como sucede en la conversaci\u00f3n humano-humano y tampoco adquieren la naturalidad de los di\u00e1logos entre dos personas. A lo sumo se produce una m\u00ednima interacci\u00f3n cuando hay ambig\u00fcedad y la computadora necesita aclarar si la canci\u00f3n que el usuario quiere escuchar pertenece a un artista u otro o si se confunde el nombre de la canci\u00f3n.<\/p>\n<p>\u201c<em>El foco de la tarea que desarrollamos en el \u00e1rea de Procesamiento del Lenguaje Natural consiste en entender las caracter\u00edsticas del di\u00e1logo humano, aprender de interacciones para que luego la computadora pueda codificarlas en sistemas de di\u00e1logo y darle la mayor naturalidad posible, es decir, que se asemeje a un di\u00e1logo real entre seres humanos<\/em>\u201d, precisa Gravano, quien es doctor en ciencias de la computaci\u00f3n.<\/p>\n<p>Gravano considera que a\u00fan se est\u00e1 a a\u00f1os de trabajo para que las computadoras logren dialogar tal como lo hacen los humanos. En este sentido, existen m\u00faltiples factores sociales, culturales y psicol\u00f3gicos del hablante; e incluso ling\u00fc\u00edsticos, por ejemplo una correcta interpretaci\u00f3n de la prosodia, es decir, las inflexiones de la voz. No obstante, el investigador aclara que se han hecho avances significativos respecto a hace 10 o 15 a\u00f1os atr\u00e1s. \u201c<em>Con el surgimiento reciente de Deep Learning o aprendizaje profundo, contamos con redes neuronales que pueden iterar eficientemente sobre millones de datos, gracias al procesamiento paralelo, retropropagando sus errores de predicci\u00f3n hasta converger a sistemas con m\u00ednimas tasas de error. Los resultados de esto se aprecian cuando un sistema es capaz de reconocer con niveles de eficacia -nunca vistos anteriormente- las palabras en el habla, o los objetos en un video<\/em>\u201d, precisa el investigador. En ese sentido, aporta algo sorprendente: actualmente en algunas subtareas, como la verificaci\u00f3n del hablante, la computadora ya muestra una tasa de error menor a la de un ser humano.<\/p>\n<p>Para resolver los interrogantes que plantean los sistemas de di\u00e1logo hablado, el equipo del ICC trabaja interdisciplinariamente en colaboraci\u00f3n con profesionales de otras \u00e1reas, como ling\u00fcistas y psic\u00f3logos, tanto de Argentina como del exterior. El grupo de investigadores suele utilizar grabaciones de conversaciones en una c\u00e1mara acustizada para evitar interferencias que perjudiquen el posterior an\u00e1lisis. Se estudian los atributos como el volumen, el tono o la intensidad de la voz que tiene la se\u00f1al de audio y con ellos se entrenan algoritmos para que aprendan distintas combinaciones de ellos. El objetivo es poder reconocer patrones que indiquen diferentes modos de hablar (si habla en tono muy elevado, si cambia la entonaci\u00f3n de acuerdo a su interlocutor o no, si habla enojado o nervioso, etc.) utilizando t\u00e9cnicas de aprendizaje autom\u00e1tico (machine learning), o en otras palabras, construcci\u00f3n autom\u00e1tica de sistemas a partir de datos. Un desaf\u00edo adicional es que estos desarrollos sean aplicables a todos los lenguajes y culturas.<\/p>\n<p><strong>Los juegos como experimentos de habla<\/strong><br \/>\nCabe recalcar que el grupo liderado por Gravano est\u00e1 implementando algunos juegos, principalmente de ingenio, para estudiar situaciones de habla humano-computadora y poder validar sus hip\u00f3tesis de trabajo. Un ejemplo es el juego de cartas Go Fish (en espa\u00f1ol el grupo lo denomin\u00f3 &#8220;A Fre\u00edr Churros&#8221;), donde el usuario le pide consejos en forma verbal a la asistente virtual (que aparece a la derecha de la imagen principal). Cada asistente virtual tiene un protocolo distinto de mimetizaci\u00f3n (entrainment), esto significa que el programa va adaptando su forma de hablar (entonaci\u00f3n, velocidad, intensidad, etc.) de acuerdo a la forma en que habla el usuario. El experimento con este software busca indagar el efecto de cada pol\u00edtica de comportamiento del sistema en las elecciones de los sujetos.<\/p>\n<p>Algunos de estos avances fueron publicados en la tesis de licenciatura de Florencia Savoretti y est\u00e1n siendo profundizados en el trabajo del doctorando Ramiro G\u00e1lvez, a trav\u00e9s de diversos experimentos tanto en el laboratorio como online (cuyo objetivo es poder incrementar la cantidad de datos obtenidos). Por otra parte, el trabajo del doctorando Pablo Brusco busca estudiar los turnos conversacionales en el habla para entender la naturalidad del di\u00e1logo y mejorarla en los sistemas de habla artificial.<\/p>\n<p><img decoding=\"async\" class=\"lazyload alignleft wp-image-1480\" src=\"https:\/\/icc.fcen.uba.ar\/wp-content\/uploads\/2019\/03\/Agust\u00a1nGravano-600x564.jpg\" data-orig-src=\"https:\/\/icc.fcen.uba.ar\/wp-content\/uploads\/2019\/03\/Agust\u00a1nGravano-600x564.jpg\" alt=\"\" width=\"299\" height=\"281\" srcset=\"data:image\/svg+xml,%3Csvg%20xmlns%3D%27http%3A%2F%2Fwww.w3.org%2F2000%2Fsvg%27%20width%3D%27299%27%20height%3D%27281%27%20viewBox%3D%270%200%20299%20281%27%3E%3Crect%20width%3D%27299%27%20height%3D%27281%27%20fill-opacity%3D%220%22%2F%3E%3C%2Fsvg%3E\" data-srcset=\"https:\/\/icc.fcen.uba.ar\/wp-content\/uploads\/2019\/03\/Agust\u00a1nGravano-200x188.jpg 200w, https:\/\/icc.fcen.uba.ar\/wp-content\/uploads\/2019\/03\/Agust\u00a1nGravano-300x282.jpg 300w, https:\/\/icc.fcen.uba.ar\/wp-content\/uploads\/2019\/03\/Agust\u00a1nGravano-400x376.jpg 400w, https:\/\/icc.fcen.uba.ar\/wp-content\/uploads\/2019\/03\/Agust\u00a1nGravano-600x564.jpg 600w, https:\/\/icc.fcen.uba.ar\/wp-content\/uploads\/2019\/03\/Agust\u00a1nGravano-768x722.jpg 768w, https:\/\/icc.fcen.uba.ar\/wp-content\/uploads\/2019\/03\/Agust\u00a1nGravano-800x752.jpg 800w, https:\/\/icc.fcen.uba.ar\/wp-content\/uploads\/2019\/03\/Agust\u00a1nGravano-1024x962.jpg 1024w, https:\/\/icc.fcen.uba.ar\/wp-content\/uploads\/2019\/03\/Agust\u00a1nGravano-1200x1128.jpg 1200w\" data-sizes=\"auto\" data-orig-sizes=\"(max-width: 299px) 100vw, 299px\" \/>Por \u00faltimo, el investigador del ICC aclara que utilizan \u201cjuegos como experimentos\u201d porque al ser entretenidos el nivel de atenci\u00f3n y de compromiso de los sujetos se mantiene alto. Cuanto m\u00e1s duran los juegos, m\u00e1s datos de habla se generan. Hasta el momento los resultados son preliminares, debido a la complejidad del di\u00e1logo humano y al hecho de que los sistemas pueden esbozar cierta \u201cpersonalidad\u201d al hablar -ninguna conversaci\u00f3n es id\u00e9ntica a la otra y se observa una amplia variabilidad entre cada uno de los di\u00e1logos entre s\u00ed-. Al mismo tiempo, la necesidad de contar con cientos de individuos para participar en el juego y hacer que los resultados del experimento sean estad\u00edsticamente significativos, vuelve a\u00fan m\u00e1s dificultosa la tarea. Sin embargo, una de las conclusiones importantes que han encontrado hasta ahora es que los resultados experimentales generados mediante el juego descripto fueron sumamente parecidos en los distintos idiomas analizados: espa\u00f1ol, ingl\u00e9s y eslovaco. Esto fue corroborado con los ling\u00fcistas que colaboran con el proyecto del ICC, quienes trabajan en institutos y universidades del exterior (Nueva York y Eslovaquia) y tambi\u00e9n han investigado la mimetizaci\u00f3n del habla.<\/p>\n<\/div><div class=\"fusion-clearfix\"><\/div><\/div><\/div><\/div><\/div>\n","protected":false},"excerpt":{"rendered":"<p>Actualmente el ICC cuenta con un \u00e1rea de Inteligencia Artificial que, entre muchos otros temas, trabaja espec\u00edficamente en el Procesamiento del Lenguaje Natural y del Habla. Tal es as\u00ed que uno de sus t\u00f3picos de investigaci\u00f3n son los sistemas de di\u00e1logo, que posibilitan una interacci\u00f3n entre [&hellip;]<\/p>\n","protected":false},"author":3,"featured_media":1478,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[71,12],"tags":[29,28,30,27],"class_list":["post-1477","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-actualidad","category-noticias","tag-aprendizaje-automatico","tag-inteligencia-artificial","tag-lenguaje","tag-procesamiento-habla"],"_links":{"self":[{"href":"https:\/\/icc.fcen.uba.ar\/en\/wp-json\/wp\/v2\/posts\/1477","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/icc.fcen.uba.ar\/en\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/icc.fcen.uba.ar\/en\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/icc.fcen.uba.ar\/en\/wp-json\/wp\/v2\/users\/3"}],"replies":[{"embeddable":true,"href":"https:\/\/icc.fcen.uba.ar\/en\/wp-json\/wp\/v2\/comments?post=1477"}],"version-history":[{"count":5,"href":"https:\/\/icc.fcen.uba.ar\/en\/wp-json\/wp\/v2\/posts\/1477\/revisions"}],"predecessor-version":[{"id":2158,"href":"https:\/\/icc.fcen.uba.ar\/en\/wp-json\/wp\/v2\/posts\/1477\/revisions\/2158"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/icc.fcen.uba.ar\/en\/wp-json\/wp\/v2\/media\/1478"}],"wp:attachment":[{"href":"https:\/\/icc.fcen.uba.ar\/en\/wp-json\/wp\/v2\/media?parent=1477"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/icc.fcen.uba.ar\/en\/wp-json\/wp\/v2\/categories?post=1477"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/icc.fcen.uba.ar\/en\/wp-json\/wp\/v2\/tags?post=1477"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}