{"id":911,"date":"2018-03-15T15:32:12","date_gmt":"2018-03-15T18:32:12","guid":{"rendered":"http:\/\/157.92.27.101\/?p=911"},"modified":"2022-03-29T10:40:47","modified_gmt":"2022-03-29T13:40:47","slug":"tecnicas-computacionales-que-ayudan-a-reconocer-emociones-en-el-habla","status":"publish","type":"post","link":"https:\/\/icc.fcen.uba.ar\/en\/tecnicas-computacionales-que-ayudan-a-reconocer-emociones-en-el-habla\/","title":{"rendered":"T\u00e9cnicas computacionales que ayudan a reconocer emociones en el habla"},"content":{"rendered":"<div class=\"fusion-fullwidth fullwidth-box fusion-builder-row-1 nonhundred-percent-fullwidth non-hundred-percent-height-scrolling\" style=\"--awb-border-radius-top-left:0px;--awb-border-radius-top-right:0px;--awb-border-radius-bottom-right:0px;--awb-border-radius-bottom-left:0px;--awb-flex-wrap:wrap;\" ><div class=\"fusion-builder-row fusion-row\"><div class=\"fusion-layout-column fusion_builder_column fusion-builder-column-0 fusion_builder_column_1_1 1_1 fusion-one-full fusion-column-first fusion-column-last\" style=\"--awb-bg-size:cover;--awb-margin-bottom:0px;\"><div class=\"fusion-column-wrapper fusion-flex-column-wrapper-legacy\"><div class=\"fusion-text fusion-text-1\"><p><em><strong>Actualmente el Instituto de Ciencias de la Computaci\u00f3n (ICC) cuenta con un Grupo de procesamiento del habla, que se ocupa de mejorar el an\u00e1lisis del lenguaje escrito y hablado o de complementar diversas tareas manuales de procesamiento con modelos computacionales m\u00e1s eficientes.<\/strong><\/em><!--more--><\/p>\n<p><span style=\"font-weight: 400;\">En este sentido, el procesamiento del lenguaje natural combina t\u00e9cnicas de las ciencias de la computaci\u00f3n con la ling\u00fc\u00edstica aplicada, para ayudar en temas de traducci\u00f3n autom\u00e1tica, sistemas de di\u00e1logo interactivos, an\u00e1lisis de opiniones y sentimientos, entre otras.<\/span><\/p>\n<p><span style=\"font-weight: 400;\">Uno de los t\u00f3picos del grupo consiste en extraer e interpretar clases de informaci\u00f3n de se\u00f1ales de audio. De este modo se puede reconocer, por ejemplo, la identidad del hablante, el estado de \u00e1nimo (si est\u00e1 enojado o no), la edad del hablante, el idioma presente en la se\u00f1al, el tipo de canal de transmisi\u00f3n y qu\u00e9 palabras son m\u00e1s utilizadas.<\/span><\/p>\n<p><span style=\"font-weight: 400;\">\u201c<\/span><i><span style=\"font-weight: 400;\">Utilizamos m\u00faltiples modelos computacionales que aprenden de distribuciones estad\u00edsticas de datos. Lo que hacemos es entrenar el modelo para que pueda cumplir una tarea espec\u00edfica y compleja trabajando con el habla humana<\/span><\/i><span style=\"font-weight: 400;\">\u201d, destaca Luciana Ferrer, Investigadora del ICC en el Grupo de procesamiento del habla. Cl\u00e1sicamente estos modelos suelen ser matem\u00e1ticos (aprenden una funci\u00f3n de los datos y devuelven una probabilidad o decisi\u00f3n concreta) y pueden tomar la forma de redes neuronales (con diferentes funciones y par\u00e1metros).<\/span><\/p>\n<p><span style=\"font-weight: 400;\">Algunos de los modelos de reconocimiento de habla pueden estar orientados al an\u00e1lisis de llamadas telef\u00f3nicas en un <\/span><i><span style=\"font-weight: 400;\">call center<\/span><\/i><span style=\"font-weight: 400;\"> de atenci\u00f3n al cliente, por ejemplo, donde hay millones de casos de personas que conversan con el operador de manera normal y relajada o y otras pocas que est\u00e1n enojadas. \u00bfC\u00f3mo se logra detectar si la persona est\u00e1 enojada o no? Los investigadores afirman que es una tarea muy compleja \u00a0pero que entrenando correctamente a un modelo de software, \u00e9ste puede tener un rendimiento parecido al humano en muchos casos.<\/span><\/p>\n<p><span style=\"font-weight: 400;\">\u201c<\/span><i><span style=\"font-weight: 400;\">Las emociones se reflejan en diversos aspectos del habla: la intensidad (volumen), la frecuencia fundamental (tono), el espectro y la velocidad. Usando esas caracter\u00edsticas se puede intentar clasificar las emociones. Cada fonema o sonido de la voz tiene cierto espectro caracter\u00edstico y adem\u00e1s hay variaciones propias de las caracter\u00edsticas espec\u00edficas del hablante y del momento en que habla. La gente enojada en general sube el volumen y el tono, aunque esto no siempre ocurre<\/span><\/i><span style=\"font-weight: 400;\">\u201d, puntualiza Ferrer. Y especifica c\u00f3mo funciona el modelo actualmente, \u201c<\/span><i><span style=\"font-weight: 400;\">los sistemas de software y reconocimiento que desarrollamos aprenden de una enorme cantidad de datos, que ya est\u00e1n procesados, y pueden ir aprendiendo cu\u00e1les son los patrones del enojo de una persona\u201d.<\/span><\/i><\/p>\n<p>&nbsp;<\/p>\n<blockquote>\n<p>Las emociones se reflejan en diversos aspectos del habla: la intensidad (volumen), la frecuencia fundamental (tono), el espectro y la velocidad. Usando esas caracter\u00edsticas se puede intentar clasificar las emociones.<\/p>\n<\/blockquote>\n<p>&nbsp;<\/p>\n<p><span style=\"font-weight: 400;\">Incluso la investigadora especialista en procesamiento de habla y aprendizaje de m\u00e1quinas, comenta que est\u00e1n comenzando a desarrollar trabajos para detecci\u00f3n de enga\u00f1o o de confianza a partir del an\u00e1lisis de lenguaje natural.<\/span><\/p>\n<p><span style=\"font-weight: 400;\">Al mismo tiempo, los modelos desarrollados en el ICC sirven para mejorar la naturalidad de los di\u00e1logos humano-computadora, controlar el acceso de un usuario a un cierto sistema o plataforma, reconocer r\u00e1pidamente la identidad de la persona y detectar el idioma hablado a partir de una se\u00f1al de audio.<\/span><\/p>\n<p><span style=\"font-weight: 400;\">En este sentido, el reconocimiento autom\u00e1tico del hablante puede utilizarse en pericias judiciales o casos forenses. Si se cuenta con el habla de la persona que en teor\u00eda podr\u00eda haber cometido el crimen y el habla del acusado, a trav\u00e9s de este modelo computacional se podr\u00eda saber si son la misma persona o no. Aunque a\u00fan los sistemas autom\u00e1ticos de reconocimiento del hablante no est\u00e1n regulados por la justicia (pero el tema legislativo se est\u00e1 discutiendo en los tribunales de todo el mundo), se sabe que el uso de redes neuronales ha igualado la performance en esta tarea comparada con el desempe\u00f1o humano.<\/span><\/p>\n<p><span style=\"font-weight: 400;\">\u201c<\/span><i><span style=\"font-weight: 400;\">Los peritos humanos escuchan las dos se\u00f1ales de cada conversaci\u00f3n y las comparan manualmente con t\u00e9cnicas dif\u00edciles de evaluar y replicar. Se ha comparado el rendimiento de humanos expertos con el de sistemas de reconocimiento de habla y se ha concluido que, en muchos casos, el desempe\u00f1o de estos sistemas es similar que el de un humano para identificar la identidad del hablante<\/span><\/i><span style=\"font-weight: 400;\">\u201d, explica Ferrer. \u00a0Esto hace que se est\u00e9 considerando incorporar de manera sistem\u00e1tica t\u00e9cnicas de inteligencia artificial para reconocimiento de voz al \u00e1mbito forense o judicial.<\/span><\/p>\n<p><img decoding=\"async\" class=\"lazyload size-full wp-image-972 alignleft\" src=\"data:image\/svg+xml,%3Csvg%20xmlns%3D%27http%3A%2F%2Fwww.w3.org%2F2000%2Fsvg%27%20width%3D%27191%27%20height%3D%27253%27%20viewBox%3D%270%200%20191%20253%27%3E%3Crect%20width%3D%27191%27%20height%3D%27253%27%20fill-opacity%3D%220%22%2F%3E%3C%2Fsvg%3E\" data-orig-src=\"https:\/\/157.92.27.101\/wp-content\/uploads\/2018\/07\/noticia_3_recuadro.jpg\" alt=\"\" width=\"191\" height=\"253\" \/><\/p>\n<blockquote>\n<p><b>\u00bfEn qu\u00e9 otros proyectos est\u00e1n trabajando?<\/b><\/p>\n<p><span style=\"font-weight: 400;\">\u201c<\/span><i><span style=\"font-weight: 400;\">Estamos elaborando un tutor virtual para aprendizaje de idiomas, en particular del ingl\u00e9s. Junto a nuestros tesistas de licenciatura, trabajamos en una herramienta interactiva que sirva para practicar pronunciaci\u00f3n, a la que le digas palabras en ingl\u00e9s y que te responda si lo dijiste correctamente o no y si lo dijiste mal te corrija muy espec\u00edficamente qu\u00e9 es lo que dijiste mal. El sistema eval\u00faa la calidad de pronunciaci\u00f3n usando dos modelos para cada fonema, entrenados con casos pronunciados correctamente y casos pronunciados incorrectamente\u201d.<\/span><\/i><\/p>\n<p><b>Cuando hacen procesamiento de lenguaje natural, \u00bfen qu\u00e9 idioma lo hacen y c\u00f3mo influye en la tarea el idioma del hablante?<\/b><\/p>\n<p><span style=\"font-weight: 400;\">\u201c<\/span><i><span style=\"font-weight: 400;\">La mayor parte del trabajo se hace en ingl\u00e9s, porque es donde mayor datos hay disponibles. Aunque tambi\u00e9n existe una enorme cantidad de datos en castellano, \u00e9sta es mucho menor. En cuanto a c\u00f3mo influye el idioma, el reconocimiento del hablante es relativamente independiente del idioma, en cambio la transcripci\u00f3n de audio o el an\u00e1lisis de texto es muy dependiente del idioma.<\/span><\/i><span style=\"font-weight: 400;\">\u201d, concluye la investigadora.<\/span><\/p>\n<\/blockquote>\n<\/div><div class=\"fusion-clearfix\"><\/div><\/div><\/div><\/div><\/div>\n","protected":false},"excerpt":{"rendered":"<p>Actualmente el Instituto de Ciencias de la Computaci\u00f3n (ICC) cuenta con un Grupo de procesamiento del habla, que se ocupa de mejorar el an\u00e1lisis del lenguaje escrito y hablado o de complementar diversas tareas manuales de procesamiento con modelos computacionales m\u00e1s eficientes.<\/p>\n","protected":false},"author":3,"featured_media":971,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[71,12],"tags":[29,28,30,27],"class_list":["post-911","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-actualidad","category-noticias","tag-aprendizaje-automatico","tag-inteligencia-artificial","tag-lenguaje","tag-procesamiento-habla"],"_links":{"self":[{"href":"https:\/\/icc.fcen.uba.ar\/en\/wp-json\/wp\/v2\/posts\/911","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/icc.fcen.uba.ar\/en\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/icc.fcen.uba.ar\/en\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/icc.fcen.uba.ar\/en\/wp-json\/wp\/v2\/users\/3"}],"replies":[{"embeddable":true,"href":"https:\/\/icc.fcen.uba.ar\/en\/wp-json\/wp\/v2\/comments?post=911"}],"version-history":[{"count":8,"href":"https:\/\/icc.fcen.uba.ar\/en\/wp-json\/wp\/v2\/posts\/911\/revisions"}],"predecessor-version":[{"id":2175,"href":"https:\/\/icc.fcen.uba.ar\/en\/wp-json\/wp\/v2\/posts\/911\/revisions\/2175"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/icc.fcen.uba.ar\/en\/wp-json\/wp\/v2\/media\/971"}],"wp:attachment":[{"href":"https:\/\/icc.fcen.uba.ar\/en\/wp-json\/wp\/v2\/media?parent=911"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/icc.fcen.uba.ar\/en\/wp-json\/wp\/v2\/categories?post=911"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/icc.fcen.uba.ar\/en\/wp-json\/wp\/v2\/tags?post=911"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}