Spanish Text Analytics eNgine

Nuestra misión

Comprender el lenguaje humano de forma automática

La tecnología semántica de Séntisis permite extraer, de entre toda la información compleja que se genera en redes sociales, conversaciones de valor que benefician el entendimiento entre personas.

Conoce nuestra metodología

¿Qué es la inteligencia del lenguaje? De NLP a NLI

Del NLP (Natural Language Processing) al NLI (Natural Language Intelligence)

¿Dónde está la diferencia? En aportar un análisis semántico, más allá de un dato cuantitativo.

El ejercicio más importante al que se enfrentan las empresas dedicadas al ‘social listening’ redunda en la idea de accionar los datos, de monetizarlos y que se conviertan en un ahorro de tiempo o beneficio económico.

En esta labor es fundamental llegar solo al dato inteligente, al que aporta valor dentro de la cadena de trabajo en la que cada profesional se encuentre inmerso. Un esfuerzo dedicado a la simplificación de la escucha para resumir el ‘Big Data’ a referencias cualitativas con las que tomar decisiones trascendentes para una marca.

Toda esta secuencia se traduce en el NLI (Natural Language Intelligence) cuya misión es extraer inteligencia humana del lenguaje frente a la simpleza del NLP (Natural Language Processing) que solo procesa la información. Si únicamente conoces las entidades que contiene un mensaje y las veces que aparecen (NLP) solo puedes cuantificar. Si sabes que un cliente va a cambiar de compañía y la causa asociada (NLI), actúas.

Análisis semántico

Cualquier texto tiene como finalidad transmitir una idea, transformar palabras y estructuras en extensiones del significado. El análisis semántico puede describir la realidad y los pensamientos a través de dos valores:

 

  •       Valor denotativo: relación entre una palabra o estructura lingüística y aquello a lo que se refiere según los cánones de la lengua donde se aplica.
  •       Valor connotativo: relación entre una palabra o estructura lingüística y aquello que evoca, sugiere, simboliza según experiencias o contextos.

 

Un idioma es un ser vivo que respira y evoluciona con el uso de sus hablantes. Es dinámico, no inmovilista. Por ello, constantemente se crean nuevos valores connotativos y algunos llegan a formalizarse tanto en el día a día que se han lexicalizado como un valor denotativo secundario.

 

Ejemplo valores semánticos:

Si estudiamos una palabra simple como puede ser ‘animal’, veremos que, en función del contexto, su significado cambia. Sin el análisis semántico, ésto sería imposible, y Séntisis se ha especializado en ello.

 

  •       Animal > Valor denotativo (sentido explícito): Ser orgánico que vive, siente y se mueve por propio impulso.
  •       Animal > Valor connotativo (sentido implícito > cuando se aplica a un ser humano): Persona de comportamiento instintivo, ignorante y grosera.

 

Por lo tanto, cuando nos referimos a un ser humano (“eres un animal” o “qué animal eres”) cambia automáticamente el valor semántico del término ‘animal’. La marcada difusión de este conocimiento ha provocado que esta definición se lexicalice y pase a convertirse en un valor denotativo de la palabra ‘animal’.

 

En este ejemplo, vemos además que el término ‘animal’ tiene otras acepciones como un sentido irracional (“animal irracional”) o sentido inteligente (“persona que destaca extraordinariamente por su saber, inteligencia o esfuerzo”). Dos ideas que parecen contrapuestas y que sólo en función del análisis semántico y el conocimiento del contexto pueden entenderse.

 

Hasta encontraríamos una quinta acepción en función del país de habla hispana en que se emite. En México y Perú, la palabra ‘animal’ significa “bicho” o “sabandija”. Una connotación claramente negativa.

 

De todo ello se extrae el reto al que se enfrenta Séntisis para ayudar a sus clientes en el estudio, no ya sólo del lenguaje, sino de lo que quieren transmitirles a su vez los clientes.

 


 

Aprende más sobre cómo trabajamos el ánalisis semántico en Séntisis

http://sentisis.com/valor-semantico-marca-la-diferencia/

 


 

Aplica nuestra tecnología semántica a otras plataformas. Conoce nuestra API en lang.ai

El motor de STAN es experto y está diseñado para la información de redes sociales en español. Como compañía nuestro reto es agregar inteligencia a cualquier tipo de texto en cualquier idioma y para esto nuestra tecnología también se puede utilizar como API a la que conectar textos como encuestas, chats, emails, contratos, licitaciones, documentación interna, etc. . Lang.ai (language AI) es la api de IA de lenguaje cuyo objetivo es entender y analizar qué patrones existen en los textos y así poder hacer más eficiente el trabajo del día a día a través de la automatización.

En concreto estamos trabajando en los siguientes casos de uso

 

Experiencia de cliente. Extraer insights de negocio de tus datos de feedback de clientes para analizar tu Customer Journey, identificando patrones de experiencia de consumo y los principales problemas y preguntas de los consumidores

 

Chatbots. Construir chatbots integrando nuestra API conversacional que no sólo es capaz de discernir el tema de la conversación sino la respuesta adecuada, entendiendo los distintos patrones y formatos de conversación y pregunta/respuesta y generando bases de conocimiento para contestar de forma adecuada.

 

Seguridad y fraude. Detectar riesgos a través del texto, bien sean regulatorios, riesgo legal, riesgo físico o ciberriesgo, riesgo de fugas de información o de fraude.

 

Gestión de documentos. Localizar y clasificar los patrones recurrentes en documentos para hacer más eficiente la gestión del trabajo a través de detección de patrones recurrentes y de detección de aquellas partes del documento a revisar o analizar de forma humana.

Conoce al detalle nuestra metodología. Patrones lingüísticos

¿Qué es la semántica?

La semántica es el estudio del significado o sentido que contienen las palabras, expresiones, símbolos o estructuras lingüísticas.

 

Mientras que en la lingüística, el enfoque gira alrededor de la composición y estructura de las lenguas, así como de su evolución histórica; la semántica lingüística se marca como objetivo: decodificar los contenidos semánticos de las estructuras lingüísticas para dotarlos de un significado.

 

¿Por qué entonces la semántica?

Porque en Séntisis no solo tenemos en cuenta la estructura del lenguaje, del texto, ni realizamos un estudio de sus componentes por separado (término a término) sino que apostamos por un análisis global para extraer el significado en función de múltiples variables como pueden ser la sintaxis (orden de los elementos) o la pragmática (el contexto).

 

Entender la estructura del lenguaje es muy importante, pero conocer su significado es lo que convierte el proceso en un valor diferencial. Esa es la razón por la que la semántica juega un papel fundamental en el trabajo diario de Séntisis: trasladar el lenguaje en datos interpretables.

 

Cualquier estructura lingüística compleja (un email, un mensaje en una red social, una base de datos, una reseña…) puede ser analizada para extraer valores semánticos como pueden ser: el sentimiento, la temática o una emoción asociada. Valores que deben traducirse en oportunidades de negocio.

 

Patrón lingüístico

Sucesión de elementos lingüísticos, empleados con frecuencia en el lenguaje y con un componente semántico atribuible. Es necesario que el patrón sea recurrente y poco ambiguo para que pueda representar un modelo reproducible y que se traduzca en reglas semánticas.

Los patrones lingüísticos están formados por reglas que consolidan una construcción semántica común. En el lenguaje hay muchas maneras diferentes de transmitir una misma idea, de ahí que sea necesario dotar a la estructura (patrón) de una biblioteca de reglas para cubrir al máximo el espectro de actuación del idioma.

Cuando Séntisis trabaja con patrones lingüísticos lo hace con palabras, conjuntos de palabras o estructuras sintácticas mucho más complejas que tienen algo en común: representan un significado en la estructura jerárquica de Séntisis para que luego puedan aplicar a categorías ofrecidas a los clientes. Por este motivo, es un campo analítico que evoluciona permanentemente con el trabajo de nuestros lingüistas y el feedback de nuestros clientes para dotar nuestro conocimiento de nuevas categorías lingüísticas.

En resumen, construir patrones sirve para detectar áreas de conversación relevantes que en función de variables (rasgos) tienen diferentes aplicaciones.

 

Rasgos

En Séntisis creamos patrones transversales a todo el lenguaje que, más tarde, desambigüamos en función de rasgos (contexto, industria, tema o foco del mensaje en el que aplica).

Los rasgos son las cualidades semánticas que permiten detectar el rango de actuación correcto de una regla para que la construcción del patrón tenga un sentido completo.

 

Ejemplos:

 

Patrón > ‘Deseo de’

Un patrón común a muchas industrias, empresas o entidades es desear algo (o su contrario: rechazar algo). Una expresión muy común en el lenguaje, con interés para una empresa, y que, gracias a los rasgos, podemos condicionar su aplicación y resultados para obtener una mayor riqueza.

 

“Me tomaría una cerveza bien fresquita ahora en la playa”.

 

En este ejemplo, el rasgo permite detectar que el patrón ‘deseo de’ apunta al sector de ‘Alimentación’ y, en concreto, a ‘Bebidas’. El resultado es un patrón con un sentido completo y que se convierte en la categoría ‘Deseo de consumo’. Un insight interesante para una marca cervecera si el dato además viene acompañado de los lugares con mayor deseo de consumo asociado (verano > temperatura > playa).

 

“Qué ganas de ver el último capítulo de ‘serieTV’, pero no puedo con Cersei”.

 

Nos encontramos con una industria diferente como la del ‘Entretenimiento’ donde el patrón ‘deseo de’ apunta a interés por un programa y el patrón ‘rechazo de’, a un personaje en concreto. El rasgo detecta que se trata de esta industria y aplica el patrón correctamente para convertirse en varias categorías dentro del mismo mensaje como pueden ser: “Personaje odiado” (Cersei) o “Contenido interesante” (SerieTV). Así es como esta información puede traducirse en novedades de guión.

Este patrón es uno de los más genéricos, pero existen otros más concretos como ‘Cambio de compañía’ que, por los rasgos, solo aplican en algunos contextos. En el sector de las telecomunicaciones un usuario sí puede expresar que se cambia de compañía, mientras que en marcas de ropa no tiene sentido.

 

“@telefoníamóvil estoy harto de la atención recibida. Me voy a @telefoníamóvil”
“Estoy harto de TIENDA. Me cambio a TIENDA”.

 

El primer ejemplo sí se da con frecuencia mientras que el segundo no.

 

¿Qué patrones son relevantes para entender a los clientes? Patrones de experiencia

Patrones de experiencia de usuario

Patrón lingüístico que pone el foco en la experiencia narrada por el usuario que emite el mensaje e interviene directamente en la actividad. Estos patrones reconocen contextos donde el protagonismo recae en el usuario, en su percepción o valoración de los hechos, y no en la entidad mencionada.

Ejemplo mensaje con patrón ‘experiencia de usuario’:

“Sigo esperando a que llegue mi pedido @restaurante. Espero que la pizza no llegue destrozada como la última vez”.

Patrón > ‘Funcionar mal’

En el lenguaje hay muchas maneras de expresar que algo no funciona correctamente o da problemas. Es así como nos planteamos el reto de detectar todas las formas de expresarlo creando reglas que construyan un patrón común, para más tarde aplicarlo a casos prácticos en función del rasgo.

1. Caída del sistema

caida-del-sistema

En el anterior ejemplo, las reglas semánticas provocan que salte el patrón ‘Funcionar mal’ entendiendo que lo que está dando problemas es un servicio digital (web), pese a que la expresión sea “caída”. Es precisamente eso, detectar que se trata de una ‘caída técnica’ del sistema (web) y no de un objeto físico como podría ser “se ha caído el bolígrafo”, lo que dota al patrón de un valor único en función de la semántica.

2. Producto defectuoso

prodcuto-defectuoso

En este caso vuelve a saltar el patrón ‘Funcionar mal’ pero asociado a un producto físico (un armario) y por lo tanto la aplicación del patrón y el valor para la empresa es diferente. Mientras que antes se tenía que resolver una incidencia que podía perjudicar las ventas online, ahora se enfrenta a un producto defectuoso y que puede provocar un reemplazo del mismo.

3. Fallo en la entrega

fallo-entrega

Por último, vemos que el patrón ‘Funcionar mal’ también puede aplicar a un servicio, como puede ser la entrega de un pedido. Y la empresa debe detectar que su servicio de entrega está teniendo percances, con un ‘fallo en la entrega’.

¿Cómo analizamos el impacto de las noticias y qué es bueno o malo? Patrones informativos

Patrones informativos o descriptivos

Patrón lingüístico donde la entidad nombrada en el mensaje es la que recibe el protagonismo, no el usuario que emite el mensaje. No se trata de una experiencia contada en primera persona sino una mensaje descriptivo sobre una empresa, persona, medicamento, etc…

“@Banco avisa de una ‘mayor’ incertidumbre económica por el Brexit”.

Patrón > promocionar

Un valor importante para cualquier marca o personaje es la publicidad que recibe o emite y cómo es percibida. De ahí que sea necesario detectar el patrón relacionado con la promoción de algo y entender su engagement (sentimiento y emociones asociados).

“MARCA aprovecha el gran tirón de ‘Pokemon GO’ para lanzar sus increíbles novedades en realidad virtual”

Contenido informativo donde el referente es la MARCA. En este tipo de mensajes es relevante conocer el patrón ‘Promoción’ pero también cómo es confeccionado el mensaje para entender el sentimiento de su impacto. “Gran tirón“ o “increíbles novedades” son expresiones que dan una buena imagen de la marca y dejan una impacto positivo de la promoción.

“@CanalTelevisión pretende rescatar al pequeño Nicolás tras hundirlo”.

Patrón informativo donde se refleja un uso promocional del “canal de televisión” pero con un contexto muy diferente al anterior por el tipo de mensaje empleado, creando una imagen conflictiva de la marca que puede afectar a su reputación. Detectar este tipo de mensajes nos lleva a categorías muy concretas y relevantes como puede ser ‘Promoción negativa’.

“EMPRESA ayuda a las pymes en la internacionalización con stands en eventos”.

En este último ejemplo observamos el cruce del patrón ‘Promocionar’ junto con el de ‘Ayudar’. En un mismo mensaje se emite una información que refleja la ayuda de una organización como ‘EMPRESA’ a las pequeñas y medianas empresas a través de la promoción y visibilidad en eventos.

¿Cómo le damos valoración a los comentarios? Emociones y sentimiento

Patrones emocionales

Hasta ahora hemos visto patrones que tienen que ver con el contexto y elemento protagonista del mensaje. Patrones que incluso pueden llevar asociado un sentimiento como es el caso de ‘Funcionar mal’. Pero el lenguaje no es tan sencillo, no solo hay temas, contextos y opiniones (sentimiento) porque no somos robots con veredictos únicos; tenemos emociones más allá de “positivo” / “negativo” y, por lo tanto, existen más características que extraer del lenguaje a través de nuestro análisis semántico.

Patrón > Asombro

“mmm… menudo anuncio el de BebidaRefrescante, no?

“El anuncio de BebidaRefrescante es muy bueno”

La emoción que se transmite es distinta, en el primer caso no podríamos llegar a saber por completo el sentimiento del comentario: ¿Positivo o negativo? Nos falta información, más mensajes del usuario, una conversación anterior o posterior… Como consecuencia, también tenemos patrones lingüísticos que captan emociones como ‘Expresar asombro’. De ellos derivan categorías que Séntisis aporta a sus clientes para que tengan una percepción aún más detallada del feedback.

En el primer ejemplo detectamos a un usuario que, por encima del sentimiento, muestra su asombro ante un anuncio. Podríamos pensar que sin sentimiento definido el resultado pierde valor, pero si el contexto es el lanzamiento de una campaña publicitaria, conocer las emociones que provoca es realmente revelador.

‘Expresar asombro’ es algo transversal al sentimiento, independientemente de que éste sea positivo o negativo. En Séntisis creemos que las emociones agregan otra capa de valor y que muchas veces aportan aún más datos que el sentimiento, porque van más allá, entran en el terreno de las impresiones o percepciones. Una virtud muy ligada con las decisiones y valores que mueven a los usuarios, clientes, audiencia, compradores…

“Una semana más sin cambios en SERIETV…soporrr”

“Una semana más sin poder despegarse de SERIETV”

Dos ejemplos donde se enfrentan un usuario que muestra ‘aburrimiento’ con otro que muestra ‘interés’. Tratándose de una serie de televisión, ambos ejemplos llevan asociado un sentimiento que es importante, pero si la misión es, por ejemplo, guionizar la serie, el patrón de emoción (cuantificarlo, ver su evolución, etc…) es clave. Sobre todo, cuando nos encontramos con casos donde además se dan hallazgos decisivos.

“Una semana más sin cambios en SERIETV…no puedo más con la historia de PERSONAJE”

Expresa aburrimiento + personaje + sentimiento negativo

“Una semana más sin poder despegarse de SERIETV, qué pasará con ‘Los Otros’?

Expresa interés + grupo de personajes + expresa expectación

¿Cómo entendemos el contexto en las distintas industrias? Temas y atributos

¿Qué entendemos por temas y atributos?

Términos que dotan a la estructura lingüística de un significado, ese es su valor diferencial: su aportación semántica. Estos elementos condicionan el significado global de la estructura en función del contexto, de ahí que sea muy importante cómo se desambigüan, algo que está directamente relacionado con el valor denotativo y connotativo que habíamos visto en el análisis semántico.

El concepto ‘leche’ puede referirse a diferentes temas, algo que sin un análisis semántico detallado sería imposible de detectar por una máquina y entregaría unos resultados y accionables erróneos.

 

Ontología

Base de datos que guarda temas y atributos (sustantivos, verbos o adjetivos) formados de una sola palabra o como locuciones (sustantivas, verbales o adjetivas). Es una biblioteca de términos que por sí misma solo sería un contenedor, un diccionario. Lo fundamental en Séntisis es el trabajo que, mediante reglas, permite desambiguar esa ontología dando como resultado: conceptos.

“Volver después de tanto tiempo lesionado es la leche”

“MARCA es la leche recomendada para niños”

La misma expresión “es la leche” puede tener connotaciones diferentes. En el primer caso ‘leche’ no representa su valor denotativo sino una expresión de alegría (‘algo + ser + cualidad’ / ‘X’ es la leche (calificativo). En el segundo ejemplo, leche sí tiene un valor denotativo refiriéndose a un lácteo (producto lácteo (marcas de leche) + ‘X’ es la leche (valor denotativo).

¿Cómo funciona el sistema semántico en tiempo real? Reglas semánticas

¿Qué son las reglas semánticas?

Las reglas son las diferentes formas que tiene Séntisis de detectar un patrón lingüístico, un tema/atributo o el sentimiento. Son una representación del lenguaje para simplificarlo y quedarnos con lo relevante y que además permiten procesar millones de comentarios en tiempo real.

 

Séntisis crea reglas para cubrir objetivos concretos dentro de su mapa estratégico. En este trabajo, el motor de AI utilizado por Séntisis y diseñado por el equipo de Data Science es capaz a través de algoritmos de discernir automáticamente patrones relevantes que se traducen en reglas que el equipo de lingüistas de Séntisis verifica y modela. Con estas reglas se cubren intereses, retos e innovaciones de la compañía, así como necesidades sectoriales o de clientes. Actualmente el sistema cuenta con 50,000 reglas para entender distintos aspectos de la conversación que se procesan en tiempo real.

 

¿Cómo construimos nuestras reglas?

Una regla está constituida por forms/lemmas, conceptos/entidades, feeds, tags o incluso expresiones regulares. La suma de estos elementos genera la regla y le confiere un valor semántico. Una arquitectura que, cuando aparece en el mensaje, tiene un significado concreto.

 

Componentes de una regla semántica:

 

  •       Forms: la aplicación de una palabra (vertido).
  •       Lemmas: raíz de la palabra (verter ).
  •       Etiqueta POS (part of speech): etiqueta morfológica (verbo en infinitivo).
  •       Conceptos / entidades: grupos de palabras que no son ambiguas (coche > vehículo).
  •       Feeds: las palabras donde debe afectar un patrón o el análisis de sentimiento.
  •       Sintaxis/estructuras semántica: el orden y estructura de los distintos elementos entre sí.
  •       Posición: la posición de cierta unidad dentro de la frase

¿Cómo se aplica este sistema semántico en los clientes? Categorías

¿Qué son las categorías?

Unidad de análisis semántico dentro del motor de Inteligencia del Lenguaje Natural de Séntisis. Las categorías son la forma de representar todo el conocimiento para que un cliente pueda accionarlo. Pueden hacer referencia a un elemento identificado en el texto y que puede tener una connotación distinta en cada sector (ej: cajero, interés, libro, retraso), así como a una intención o función del comentario que se analiza (ej: duda, queja, funcionar mal).

Existen muchos tipos de categorías en función de aspectos contextuales como la industria o la entidad estudiada, además de otros más técnicos como el tipo de reglas y patrones que llevan incorporadas. En términos generales, Séntisis hace una distinción entre tres tipos de categorías:

 

Categorías lingüísticas / market categories

Son las categorías que dependen directamente de reglas semánticas para detectar áreas lenguaje. Necesitan estructuras lingüísticas complejas que aislen significados y expresiones dentro de una conversación para agruparlos en una única categoría.

De esta manera, se podrán etiquetar aspectos lingüísticos clave del mensaje para poder medir por ejemplo su significado: la reputación de una marca (‘Conflicto empresarial’), la atención a sus clientes (‘Calidad de la respuesta’) o el nivel de sus productos y servicios (‘Incidencia con el pedido’). Y otras veces, lo importante de la categoría es que no advierte sólo del significado sino también de la función del mensaje (informar, aconsejar, enfrentar…)
Categorías temáticas / identificativas

Son categorías que recogen términos concretos dentro de la ontología de Séntisis (biblioteca de conceptos jerarquizados a partir de áreas del conocimiento) y que sirven para identificar tipos de entidades, por ejemplo: material de construcción (yeso, ladrillo, hormigón), instalación deportiva (gimnasio, pabellón, cancha), profesional (médico, abogado, etc.), parte del cuerpo humano (mano, brazo, codo), etc. Idealmente, estas categorías deben imitar la estructura de una ontología.

 

t\CONSTRUCCIÓN MATERIAL
          t\EDIFICACIÓN
                    t\EDIFICACIÓN (PARTE)
                               t\MURO
                    t\ENTIDAD DE VIVIENDA
                               t\VIVIENDA
                                          t\APARTAMENTO
                                          t\ÁTICO
                                          t\CHALÉ
                                          t\DÚPLEX
                                          t\FINCA
                                          t\LOCAL
                                                    t\ESTABLECIMIENTO
                                          t\LOFT
                                          t\PISO

 

Séntisis utiliza estas categorías temáticas para cruzarlas con patrones transversales al idioma y generar un nuevo territorio de categorías lingüísticas que esclarezca nuevas zonas del mapa de conocimiento global. Es así como surge:

 

stan-categorias

Categorías manuales

Dentro de su repertorio, Séntisis también ofrece la posibilidad de crear categorías de forma manual para cubrir aspectos muy específicos de una conversación y que, por no ser transversales a todo el lenguaje, no ofrecen garantías de cubrirse lingüísticamente.

Las categorías manuales están formadas por keywords o palabras clave y tienen como principal función: segmentar una parte de la escucha para más tarde conocer los datos más importantes a su alrededor y trabajar con ellos.

Únete a las empresas que ya trabajan con la tecnología de Séntisis

Contacto