Se está utilizando el procesamiento del lenguaje natural para automatizar el etiquetado de artículos e impulsar el SEO.
Con una historia que se remonta a cuatro siglos atrás, el grupo editorial DuMont de Colonia comenzó a publicar libros de oraciones en 1620 y publicó su primer periódico en latín.
Propiedad de la aristocrática familia DuMont desde 1805, el grupo editorial posee diez periódicos locales en Alemania, entre ellos el histórico Kölner Stadt-Anzeiger y el tabloide EXPRESS, con sede en Colonia.
La empresa tiene una larga historia de innovación tecnológica, ya que adoptó su primera prensa de alta velocidad en 1833.
La organización adoptó en 2021 una ambiciosa estrategia de digitalización impulsada por la IA en todos sus sitios de periódicos, centrándose en el etiquetado y las páginas temáticas.
La tecnología de IA lee y categoriza artículos para impulsar el SEO
El grupo editorial DuMont está interesado en la edición y comercialización de libros, así como en la publicación de periódicos, información comercial especializada, así como soluciones SaaS en el área de tecnología de marketing. Tiene grandes ambiciones de integrar la inteligencia artificial en muchas de sus operaciones, con un "Círculo de IA" dedicado dentro de la empresa que se centra en proyectos específicos de IA.
Kölner Stadt-Anzeiger Medien (KStA Medien), la editorial de periódicos de DuMont, tiene un gran número de lectores en su región natal de Colonia y Bonn, y la empresa esperaba utilizar la IA para impulsar la circulación, el alcance y las suscripciones digitales en sitios web como Express.de y Ksta.de.
La empresa recurrió a los expertos en metadatos y taxonomía iMatrics para aumentar el alcance y el SEO en todos los sitios, utilizando un software que lee y clasifica automáticamente los artículos.
El problema del SEO manual
Anteriormente, la organización dependía de que el personal introdujera manualmente las palabras clave, lo que generaba problemas, dice Alina Gerber, científica de datos de Kölner Stadt-Anzeiger Medien.
Gerber dice: "Como científico de datos, tenía muchas preguntas sobre: '¿Qué tipo de temas les gusta leer a los lectores? ¿Qué funciona bien?'. Pero solo teníamos las categorías que se veían en la navegación, cosas muy amplias como la sección de deportes o la política regional".
El otro problema es que las personas no tienden a ingresar las mismas palabras clave, incluso cuando escriben sobre los mismos temas, dice Gerber.
"Esto era lo principal con lo que estábamos luchando, porque teníamos palabras clave, pero se ingresaban manualmente, y las personas no solo cometen errores, sino que ingresan las palabras clave de manera diferente cada vez. Aprendí que había más de 100 formas de escribir FC Köln, que es nuestro club de fútbol local".
La respuesta estaba en la inteligencia artificial y, en particular, en el procesamiento del lenguaje natural o PNL, dijo Gerber.
Antes de acercarse iMatrics, la empresa ya estaba experimentando con el uso de la IA en la redacciónde diferentes maneras.
KStA Medien ya había experimentado con el uso de un servicio impulsado por IA para permitir a los reporteros acceder a datos sobre los lectores, dice Robert Zilz, jefe de datos de Kölner Stadt-Anzeiger Medien.
Zilzs dijo: "Hemos realizado muchos análisis de datos y generado una gran cantidad de información: tenemos muchos usuarios que visitan nuestros sitios web y tenemos un conocimiento muy profundo de ellos gracias al backtracking y a las soluciones de seguimiento personalizadas nativas de la nube.
"Esperaba permitir que las personas trabajaran de una manera más basada en datos, no en términos de leer paneles o leer informes, o preguntar al equipo de datos, sino más bien ser más autosuficientes".
El etiquetado automático de artículos impulsa el alcance, la publicidad y la personalización
La idea de utilizar el procesamiento del lenguaje natural para comprender y etiquetar artículos es relativamente nueva.
Zilz espera que al categorizar los artículos utilizando la tecnología de iMatrics, KStA Medien pueda impulsar el alcance, impulsar la publicidad y personalizar el sitio para los usuarios.
"Teníamos la visión de que podríamos usar la PNL para comprender mejor la información de nuestros artículos.
"Fue un punto de inflexión para nosotros contar con un servicio de procesamiento de lenguaje natural dentro del sistema de gestión de contenidos en el que el equipo editorial realiza su trabajo diario, sin interrumpirlo".
iMatrics etiqueta los artículos automáticamente, gestionando los metadatos para crear páginas temáticas.
Zilz dice que hacer esto hizo que las historias de los periódicos fueran más visibles para los "bots" que Google utiliza para crear sus resultados de búsqueda. Google es una de las principales fuentes de tráfico de la compañía, representando hasta el 60% del tráfico del sitio.
"Fue muy importante mirar a nuestra mayor fuente de tráfico, Google, y asegurarnos de que estamos haciendo todo lo posible, utilizando las páginas temáticas para ganar confianza y visibilidad. Esta es una de nuestras características principales".
Zilz ahora espera construir otras aplicaciones utilizando los artículos etiquetados, particularmente en torno al servicio de publicidad en vivo de la compañía.
Con las cookies de editores de terceros que se desactivarán en el navegador Chrome de Google el próximo año, la capacidad de publicar anuncios contextuales basados en datos del sitio web será aún más importante.
En express.de las páginas temáticas sobre temas que van desde la Colonia Joven hasta Boris Becker representan ahora el 10% de la visibilidad del sitio en las búsquedas.
Los clics en las páginas temáticas aumentaron un 50% en un año, tras la integración de iMatrics, y generaron más tráfico en todo el sitio.
La compañía ahora espera trabajar en estrecha colaboración con iMatrics para construir más aplicaciones basadas en metadatos de artículos.
Zilz dice: "iMatrics está muy al mismo nivel que nosotros, y están muy entusiasmados con la idea de adentrarse más en el mundo de la IA".