Tecnología y Semántica

El análisis de sentimiento. ¿Aplicación directa al negocio de las empresas?

January 11, 2021

El procesamiento de lenguajes naturales – abreviado PLN, o NLP del idioma inglés Natural Language Processing – es un campo de las ciencias de la computación, inteligencia artificial y lingüística que estudia las interacciones entre las computadoras y el lenguaje humano.

Procesamiento de lenguajes naturales

El análisis de sentimiento es uno de los campos del PLN que podría tener alguna utilidad para los negocios con el fin de reducir una frase a positiva/negativa o neutra. Pero, ¿Qué utilidad tiene?

A partir del análisis de sentimiento surgen los retos tecnológicos

Séntisis nace en el año 2012 gracias al proyecto de fin de Master de uno de los fundadores, Jorge Peñalva, medalla de honor de su promoción de ingenieros de Telecomunicación y beca de excelencia durante 5 años por la Comunidad de Madrid. Financiado en parte con estas becas, Jorge hizo un Master en Chicago en Computer Science. Allí tuvo la oportunidad de trabajar con Shlomo Argamon, experto en el campo de análisis de sentimiento a nivel mundial y que en la actualidad es advisor tecnológico de la compañía. Conociendo el campo, Jorge detectó una oportunidad en el mercado dado que gran parte de la investigación se había dedicado al inglés y además la investigación estaba muy lejos de lo que, en su opinión, demandaba el mercado. Todavía 10 años después de este paper publicado por la Universidad de Cornell se seguía vendiendo a nivel comercial el análisis de sentimiento.

Nuestra experiencia de 5 años en el mercado nos permite identificar el gran handicap que tiene el análisis de sentimiento.

Distintas industrias generan distintas conversaciones. Por ejemplo, la palabra “banco”, cuando hablamos de una entidad financiera es una parte clave del mensaje, mientras que cuando hablamos de una marca de cervezas normalmente no lo es.

Análisis de sentimiento


En el primer ejemplo sabemos que “peor” va asociado a “banco”, que es el foco del sentimiento; y que “cobrarme comisiones” es un patrón que representa una categoría, ‘cobro de comisiones’, que puede ser útil para el cliente.

Sin embargo en el segundo ejemplo, “banco” no es un foco relevante para la industria de la cerveza por lo que ignoraríamos el sentimiento que tiene asociado, aunque sí tomaríamos como foco en este caso la palabra “litrona”, así detectaríamos el patrón “beberme una litrona”, que representaría la categoría “deseo de consumo”, que suele corresponder con un resultado positivo para el cliente.

Por esto, es clave entender la conversación dentro de cada tipo de industria y discriminar qué mensajes son relevantes y cuales no; categorizarla para extraer patrones y detectar los focos (entidades sobre las que recae el sentimiento positivo o negativo).

Veamos otro ejemplo:

Análisis sentimiento negativo

Tomando como foco la palabra “litrona” para la industria de la cerveza, este mensajes sería negativo para el cliente, puesto que detectamos el patrón peor + foco.

Como vemos, es clave conocer cada industria para llegar a ser preciso tanto en la identificación de posibles patrones como para entender si realmente el sentimiento de un mensaje va asociado a la entidad que nos interesa, bien sea porque va directamente asociado a la entidad que se monitoriza (nombre propio de la marca, empresa o producto), o porque va asociado a otra palabra que consideramos foco de la entidad monitorizada (como “banco” en el sector de banca o “litrona” en el sector de cerveza).

Clasificación de mensajes

Ambos son comentarios que probablemente podrían discutirse si son negativos o neutros, lo cual supone que sea complejo desarrollar un proceso de negocio basado en esa información.

En base a nuestra experiencia con clientes, es mucho más fácil cuando esto se resume en un patrón o categoría llamado “falta de suministro” o “falta de cobertura” donde realmente se entiende el contexto del comentario y no existe ambigüedad.

Estos patrones sectoriales más allá del sentimiento y emociones no necesariamente llevan un sentimiento asociado, por ejemplo analicemos otro patrón como “cambio de compañía”. Este patrón es claramente malo para una compañía pero, ¿Lleva implícito un sentimiento negativo? No tiene por qué, te lo enseñamos:

Clasificación de mensajes

El mundo actual es competitivo y como vemos pueden existir patrones que van más allá del sentimiento. Estos patrones normalmente tienen sentido en ciertos sectores, no en todos, ya que hay compañías de servicios donde te puedes cambiar de una a otra, como en banca, pero existen otras industrias donde esto no tiene sentido.

Análisis de mensaje

No es un comentario estándar que sea natural para esta industria. No obstante existen otros patrones exclusivos para una industria que no aparecen en otros. Ejemplo “momento de consumo” en el sector de bebidas:

Clasificación de mensajes

En este caso es muy relevante para la marca cervecera poder detectar cuánta conversación habla del momento en que se consume y además, en qué momento o actividad específica se consume la cerveza. Como en el primer caso, este patrón es transversal al sentimiento. El segundo comentario sí es positivo porque utiliza el concepto de disfrutar pero en el primero no tiene por qué estar disfrutando, ya que no lo expresa en el mensaje. Podría decir: “con mis amigos bebiendo ron Negrita. Me convencieron para beber esta basura”. ¿Es positivo? Por un lado lo está tomando pero realmente su opinión es que es un ron malo. El patrón es “momento de consumo” pero con un sentimiento asociado negativo.

Estos patrones son clave en muchas industrias para llegar al detalle de la conversación y poder detectar tendencias o patrones que no deberíamos conocer. Los accionables son evidentes desde el trabajo con casos específicos (contactar con el usuario antes de cambiar de compañía), hasta desde el punto de vista de la investigación entender en qué momento sucede cada patrón ¿Cuándo y por qué toman los jóvenes Ron Negrita?
Durante estos 5 años uno de los principales objetivos de Séntisis ha sido el desarrollo de estos patrones o categorías que cumplen lo siguiente:

  • Estén adaptados a cada industria.
  • Sean accionables.
  • Sean patrones con una carga semántica relevante.
Etapas del análisis y clasificación de mensajes

También hemos aplicado la tecnología a clasificación de comentarios con impacto a nivel de comunicación donde hay que detectar cierto nivel de discurso y otras variables no sólo semánticas:

Insights

Para entender la categorización de Séntisis, ésta se distribuye de dos formas:

Verticalmente:
La categorización sigue una jerarquía en la que se clasifican los temas de la realidad que monitorizamos, en sentido descendente, desde lo más genérico a lo más específico. Sus divisiones principales son: empresas que ofrecen servicios, productos tangibles, productos audiovisuales, personas y zonas administrativas. Estos grandes bloques comparten similitudes en cuanto a expresiones del lenguaje natural se refiere. Por ejemplo, una persona puede ser alta o guapa mientras que una empresa no puede ser guapa. Sin embargo en un producto tangible una situación o producto sí puede ser guapo: “Qué guapo el nuevo BMW” ó “Ya con mi Heineken en la playita. Qué guapo este finde!”.

Horizontalmente:
Las categorías también se distribuyen en capas horizontales que abarcan varios sectores de manera transversal. Estas categorías son aplicables a la mayoría de los tipos de industrias. Un caso evidente de jerarquización horizontal es la atención a clientes. Si bien los bancos o aerolíneas pueden tener más volumen de este tipo de conversación, prácticamente cualquier marca tiene un servicio de atención a cliente al que acudir si existe un problema, y eso genera comentarios similares sobre el servicio, atención, tiempo de espera al teléfono… que definitivamente tienen una semántica muy parecida independientemente del sector o industria en el que aparezcan.

Hacia el futuro toda la jerarquización debería ser horizontal, excepto en lo específico de cada industria o incluso de cada compañía; ‘producto tangible’ podría ser una categoría horizontal ya que pueden existir compañías como Ikea que venden productos tangibles y a la vez tienen conversación de servicios porque envían el paquete y por tanto tienen logística, venden online, tienen atención telefónica, etc… Prácticamente cualquier compañía que venda productos acabará ofreciendo un servicio hacia el futuro, y será clave entender cada uno de los rasgos que al final son horizontales a todos.

Las preguntas que cualquiera se debería hacer en este punto que vivimos actualmente es:

  • ¿Cómo se extraen estas categorías o patrones?
  • ¿Es un proceso automático?
  • ¿Serviría para extraer patrones de cualquier tipo de texto?

Estas preguntas resumen el objetivo del proyecto Séntisis: En textos escritos de cualquier fuente, ser capaces de identificar automáticamente patrones que tengan sentido para procesos de negocios. Agilizando y escalando un proceso que parte de la fuente de redes sociales y llevarlo a cualquier tipo de fuente y texto.

Antes de terminar me gustaría dejaros unos datos sobre el mercado de inteligencia artificial donde se enmarca el análisis de texto. Crece al 62% anual para llegar a 16 Billones estimados en 2022 (leer artículo). La necesidad es imperiosa en el mercado para mejorar procesos que hasta ahora no se hacen o hacen humanos. Sectores como el sector de experiencia de clientes, el sector legal, el sector de la seguridad y análisis de riesgos necesitan de inteligencia artificial para resolver problemas de análisis de texto donde el volumen es insostenible para un humano. Por ejemplo, pongamos un caso real de análisis de competencia desleal. Un despacho de abogados en un caso de competencia desleal debe analizar millones de interacciones (emails, whatsapps, etc) de los comerciales para entender si ha existido competencia desleal o no, y todo este proceso deben realizarlo en solo unos días. El motor debe ser capaz de a través de millones de comentarios identificar ese patrón de negocio/semántico de forma automática y que ya quede modelado en una API para futuros casos.

Por ello queremos que este sistema sea una pieza básica, a la par del desarrollo de un mercado que va a explotar en los próximos años y donde en mi opinión todas las estimaciones respecto a su impacto económico se quedan cortas dado que no existen datos suficientes para estimar el impacto que puede suponer en múltiples procesos de las compañías.



Suena bien, ¿verdad?