En noviembre de 2021, un informe de McKinsey mostraba que el 71% de los usuarios espera una experiencia personalizada cuando navega por Internet1. En concreto, esperan disponer del contenido adecuado en el momento oportuno. Alcanzar este objetivo es la base del comercio y el marketing contextuales, cuyo objetivo es aumentar la tasa de conversión. Sin embargo, para ello es necesario recopilar una cantidad impresionante de datos con el fin de sugerir el contenido o producto adecuado en el momento oportuno. Este es el papel clave que desempeñan los motores de recomendación, que se basan en la inteligencia artificial y el aprendizaje automático.
¿Qué es un motor de recomendación?
Un motor de recomendación es una herramienta que utiliza la inteligencia artificial y el aprendizaje automático para sugerir automáticamente contenidos o productos a los internautas. Además de ser automáticas, las recomendaciones son dinámicas y personalizadas gracias a la alimentación diaria, o incluso en tiempo real, de una gran cantidad de datos sobre los usuarios. El rendimiento de los motores de recomendación depende, por tanto, de su capacidad para procesar estos datos.
Lea nuestro Libro Blanco sobre comercio contextual
¿Cómo funciona un motor de recomendación?
El proceso de recomendación de contenidos en línea se basa en una secuencia de pasos.
Recogida de datos
Un motor de recomendación recoge 2 tipos de datos relevantes para definir el perfil de los usuarios:
- datos implícitos: se trata de datos que el usuario no facilita intencionadamente y que se recogen durante sus actividades en Internet. Se trata, por ejemplo, de las páginas visitadas, los clics, las palabras utilizadas en una búsqueda o el historial de compras.
- datos explícitos: se trata de información transmitida por el usuario. Puede tratarse de "me gusta" en redes sociales, opiniones publicadas tras compras, contenidos publicados por el propio usuario en internet o intercambios con otros usuarios.
Almacenamiento de datos
El rendimiento de un motor de recomendación depende en parte de su capacidad para almacenar los datos que recopila. Los motores de recomendación se basan en bloques tecnológicos extremadamente potentes, los únicos capaces de hacer frente a las 3 dimensiones de Big Data2 :
- volumen: los motores de recomendación almacenan volúmenes gigantescos de datos digitales
- velocidad: hacen frente a la enorme velocidad a la que se generan los datos
- variedad: almacenan una creciente diversidad de datos
Volumen, velocidad y variedad son los 3 aspectos esenciales de Big Data
Análisis de datos
A continuación, los motores de recomendación analizan los datos recogidos y almacenados. Siguen una metodología, es decir, un conjunto de reglas definidas de antemano y adaptadas a la estrategia adoptada por la empresa de la que depende el sitio web. Los enfoques difieren en función de numerosos parámetros: los objetivos de la recomendación, la naturaleza del sitio, el tipo de información recogida y analizada, etc.
Existen 3 enfoques comunes, también llamados "filtros", a saber
- filtro colaborativo
- filtro basado en el contenido
- filtro híbrido
Filtro colaborativo: método que consiste en encontrar similitudes entre los datos anteriores de un panel de usuarios y los del usuario actual. Este método se basa en la hipótesis de que si existen similitudes en la preferencia por determinados elementos entre el panel de usuarios y el usuario objetivo, existe una alta probabilidad de que a este último le gusten otros elementos que haya seleccionado. Estas recomendaciones se basan en datos recogidos automáticamente sin ningún análisis de sus características.
Filtro basado en el contenido: este enfoque analiza las características de los datos. Estos datos pueden ser, por ejemplo, los atributos de los productos del catálogo para un sitio de comercio electrónico, o los temas de contenido para un medio de información. En segundo lugar, se expresa el perfil del usuario objetivo enumerando sus preferencias en cuanto a las características de los datos del sitio. En este caso, las recomendaciones se basan en las coincidencias identificadas entre los atributos de los datos referenciados y los gustos del usuario. Este método se basa en el supuesto de que existe una alta probabilidad de que al usuario objetivo le gusten características similares a las que le han gustado en el pasado. Estas recomendaciones se basan en el comportamiento pasado del usuario sin preocuparse de disponer de datos sobre otros visitantes.
Filtro híbrido: estrategia que combina los dos tipos de filtrado anteriores. Combinan las preferencias del visitante objetivo con los datos de la comunidad, los atributos de los artículos del catálogo y otros modelos de recomendación.
Burbujas de filtro y serendipia
Una burbuja de filtros es un fenómeno que se produce cuando un algoritmo sólo presenta elementos similares a los gustos del usuario. Esto crea el riesgo de que el usuario quede encerrado en un entorno sin explorar otras áreas. De ahí la necesidad de introducir contenidos aleatorios o, dicho de otro modo, de introducir un cierto nivel de serendipia en los algoritmos de los motores de recomendación.
La serendipia es "el acto de hacer un descubrimiento inesperado por casualidad que más tarde resulta ser fructífero, especialmente en las ciencias...".3 ".
Los algoritmos también pueden dejar espacio al azar proponiendo deliberadamente contenidos aleatorios que caen fuera del área de intereses cercanos o conocidos del usuario.
La combinación de ambas prácticas permite un funcionamiento óptimo y ético de los motores de recomendación.
Los algoritmos de los motores de recomendación introducen regularmente contenidos aleatorios para evitar burbujas de filtros a los usuarios.
¿En qué datos se basa un motor de recomendación?
Datos sociodemográficos
La recogida de datos sociodemográficos sobre los consumidores es una etapa esencial para los motores de recomendación. En efecto, la edad, el sexo, el origen, la lengua, la situación familiar y profesional influyen no sólo en el comportamiento de navegación, sino también en el de compra. En el comercio electrónico, por ejemplo, el 30% de los hombres realizan al menos una compra a la semana, frente al 24% de las mujeres. Del mismo modo, los Millennials realizan casi el 35% de las compras en línea, frente al 30% de la Generación X y sólo el 15% de los Baby Boomers.4. Estos datos sociodemográficos también influyen en los intereses y las categorías de los artículos comprados. En concreto, un estudio de Eurostat reveló que los jóvenes de 16 a 24 años son el grupo de edad que más ropa compra en línea, seguidos de cerca por los de 25 a 54 años. En cambio, los mayores de 55 años son los que más compran muebles y artículos para el hogar.5.
Datos personales
Además de los datos sociodemográficos, los datos personales -implícitos y explícitos- son esenciales para elaborar el perfil de los consumidores. La recogida y el cruce de estos dos tipos de datos reducen y precisan, por tanto, el perímetro de los contenidos que deben sugerirse, así como el momento y el lugar propicios para su difusión. Así funciona, por ejemplo, la recomendación de productos de Amazon. Los algoritmos analizan las listas de deseos de los usuarios, los productos que buscan, el tiempo que pasan en cada página de producto y sus compras anteriores. Así, la recomendación de productos de la plataforma suele ser pertinente.
Pero es en las redes sociales donde los motores de recomendación tienen acceso a un volumen, una variedad y una precisión excepcionales de datos sobre los usuarios6. Los datos se nutren de los contenidos consultados y compartidos por los usuarios, pero también de las interacciones e intercambios con otros usuarios. Los algoritmos de las redes sociales definen con precisión los intereses y perfiles demográficos de cada visitante. Así, las recomendaciones del comercio social son extremadamente precisas y tienen un alto nivel de rendimiento.
Bases de datos y transacciones
Las bases de datos y el historial de transacciones se analizan y clasifican para optimizar la sugerencia de contenidos. Las características de los productos introducidas en las bases de datos CRM, PIM o DMP son utilizadas por los sitios de comercio electrónico o los marketplaces. Estos atributos de producto permiten a los algoritmos hacer asociaciones relevantes durante el proceso de recomendación. Por ejemplo, un sitio de comercio electrónico de artículos de cocina sugerirá un espumador de leche a un usuario que esté consultando la página de producto de una cafetera. Además, estas características del producto se complementan con el historial de transacciones, como la popularidad entre los usuarios, los productos más vendidos, las vías de venta adicionales de otros usuarios y las opiniones de los clientes. Del mismo modo, una plataforma de contenidos analiza las interacciones de sus lectores con sus contenidos: el índice de consulta e interacción de los internautas, las opiniones emitidas, el tiempo de lectura, etc.