Índice

Sponsors

cic kodak3 kodak3

logo-atdl

Asociación Técnica de Diarios Latinoamericanos

Índice

Boletín Semanal Julio 4, 2021
 

La duplicación de sitios web, en la que el contenido se elimina al por mayor de un sitio web y se aloja en otro lugar sin permiso, podría estar costando a los editores de noticias del Reino Unido millones en pérdida de ingresos y recursos.

Es un problema que parece estar creciendo, pero que muchos editores de noticias pueden desconocer que los está afectando.

Mientras que algunos equipos de noticias se quejan de que sus historias son "estafadas" cuando aparecen en títulos rivales sin suficiente crédito, la duplicación de sitios web lleva el robo de derechos de autor a un nivel más serio.

Una marca de noticias nacional, a la que se le ha pedido a Press Gazette que no nombre, tenía todo su sitio web clonado y alojado en una dirección web que era solo una letra diferente del sitio web original. El sitio falso, que Press Gazette ha visto en una imagen, fácilmente podría haber sido confundido con la cosa real.

Fue retirado después de una intervención de NLA Media Access (anteriormente la Agencia de Licencias de Periódicos), que trabaja en nombre de los editores de noticias del Reino Unido para administrar sus derechos de autor. Pero no solo los títulos nacionales se ven afectados.

The Grocer, un título B2B para la industria de alimentos y bebidas, descubrió que su contenido original aparecía palabra por palabra en otro sitio web llamado UK Food &Drink, que nuevamente se detuvo después de que la NLA interviniera.

Y el sitio web local Kent Online, parte del Grupo KM, propiedad de la editorial regional Iliffe Media, descubrió que sus informes estaban siendo levantados en su totalidad y publicados en el Kent Chronicle, un sitio que había surgido de la nada. Después de una investigación, Kent Online encontró que el sitio parecía haber sido la creación de un whizz de tecnología adolescente y fue derribado.

Estos sitios web duplicados utilizan rastreadores web para raspar contenido en sitios web legítimos y publicarlo en otro lugar. Sin embargo, algunos rastreadores son totalmente legítimos y pertenecen a organizaciones asociadas. Los principales infractores son los sitios de noticias falsas, los sitios de clonación o las "granjas de contenido agregado".

El año pasado, NLA Media Access retiró unos 20.000 artículos de más de 700 fuentes en nombre de los editores de noticias del Reino Unido. Alrededor de la mitad de todos los casos son el resultado de la ignorancia general sobre la ley de derechos de autor, mientras que la otra mitad son aquellos que "saben lo que están haciendo", según Matt Aspinall, jefe de servicios de editores de NLA Media Access.

La NLA ha estado utilizando un sistema de seguimiento de artículos en línea de terceros desde 2015 para buscar activamente instancias de duplicación web. Trajo la tecnología internamente el año pasado y construyó su propio servicio de rastreador de texto.

Aspinall dijo que los editores "a menudo no conocen la escala de [la duplicación de sitios web] ellos mismos", y agregó: "No saben que están perdiendo esos preciosos globos oculares en sus artículos". Puso el ejemplo de un título nacional que desconocía que sus artículos habían sido "arrancados".

Aspinall dijo que la NLA comenzó a trabajar con un gran grupo regional en abril y a finales de mes había encontrado 500 artículos que habían sido retirados de sus sitios web y republicados en 15 "sitios ilegales".

Si bien el 90% del contenido que la NLA encuentra y elimina proviene de sitios web de noticias sin muros de pago, Aspinall dijo: "No creo que los editores que tienen modelos de suscripción deban hacerse ilusiones de que su contenido es seguro porque tienen un muro de pago".

En 2019, la NLA encontró un sitio web "tan descarado como 'detrás del muro de pago' punto algo u otro y eran artículos enteros de las principales marcas de muros de pago, que obviamente cobran mucho dinero para que los lectores accedan", dijo.

Aspinall dijo que cuando la NLA comenzó su tarea principal era apuntar a las granjas de contenido, que agregan contenido sin permiso ni pago, pero cada vez se ven más sitios web duplicados que el "lector desprevenido ... creería que es un sitio de noticias legítimo, cuando en realidad tiene contenido que fue arrancado de un sitio de noticias legítimo".

Dijo que sospechaba que los editores "no saben la escala de cómo está sucediendo eso, porque no lo están rastreando proactivamente en este momento", sino que solo reaccionan a los problemas a medida que surgen.

La Asociación de Medios de Comunicación dijo: "Los sitios de noticias falsas que no invierten nada en periodismo real, pero que levantan y buscan monetizar el contenido de los medios de comunicación genuinos, no tienen lugar en nuestra sociedad democrática. Socavan cínicamente los esfuerzos de los periodistas reales que trabajan para mantener informado al público en un momento de crisis nacional.

"Lamentablemente, en los últimos meses hemos visto varios ejemplos de estos sitios web dirigidos a sitios web de noticias locales genuinos de una manera sistemática. Representan una amenaza directa para el periodismo y deben ser detenidos".

Richard Reeves, director general de la Asociación de Editores en Línea, estima que el impacto financiero en la industria de las noticias es considerable.

Dijo: "No supongo que nadie haya hecho una investigación real... pero si en términos de conducir el tráfico a otro destino que no es el sitio legítimo, y ese tráfico no se puede cumplir en términos de monetización, y el impacto que tiene, no es una cifra conservadora, será de millones, potencialmente de miles de millones".

No solo la duplicación del sitio web le cuesta a un editor publicidad e ingresos por suscripción, sino que "el sitio fraudulento todavía está poniendo presión sobre el servidor host original, el legítimo", dijo Reeves, porque en lugar de construir algo nuevo, simplemente está eliminando el sitio web original. Esto deja a los editores pagando costos de recursos adicionales para apoyar la cepa, a menudo mientras no son conscientes de la causa.

"Si hay 100.000 personas en un momento dado mirando una página de inicio, el servidor del editor dice que necesitamos optimizar el rendimiento porque tenemos unas 100.000 personas", explica Reeves. Pero cuando un sitio está siendo duplicado, dijo que el "rendimiento está funcionando más parecido a tener 400,000 personas en la página de inicio".

"Los editores se ven afectados definitivamente en recursos, costos, tráfico, legitimidad, velocidad, rendimiento, clasificaciones", dijo Reeves, quien ha pedido más conciencia de la amenaza de duplicación de sitios web en la industria de las noticias.

"Pero más que nada, hay una motivación más grande para que todos nosotros abordemos esto porque es lo que continúa alimentando la capacidad de que nuestros datos se copien y clonen y se vuelvan a aplicar de manera fraudulenta".