Розробників ШІ викрили в зборі даних із сайтів ЗМІ всупереч прямим заборонам

13:10, 23.06.2024

Кілька компаній, що займаються розробкою систем штучного інтелекту, ігнорують ухвалений галуззю веб-стандарт, який дає змогу видавцям блокувати збирання свого контенту з метою його подальшого занесення до масивів для навчання генеративного ШІ. Про це повідомляє Reuters.

Інформація про неправомірні дії розробників ШІ щодо сайтів ЗМІ з'явилася в рамках публічного розгляду ШІ-стартапу Perplexity і ресурсу Forbes, водночас компанії, які, імовірно, виявилися правопорушниками і постраждалими, не називаються. Ділове видання публічно звинуватило Perplexity в плагіаті матеріалів своїх розслідувань - у зведеннях, що складаються генеративним ШІ, виявляються матеріали Forbes без запитів дозволу і посилань на авторів. Пошуковий веб-сканер Perplexity, імовірно, ігнорує директиви, які вказуються видавцями у файлі robots.txt - поширений стандарт допомагає адміністраторам сайтів визначати, які розділи дозволено сканувати пошуковим роботам.

Про проблему повідомила компанія TollBit - стартап, який виступає посередником між ШІ-компаніями, що відчувають потребу в навчальних матеріалах, і відкритими для укладення ліцензійних угод видавцями. Perplexity - не єдиний порушник, який, ймовірно, ігнорує директиви robots.txt, вважають у TollBit. Зараз у базі посередника значаться 50 видавців, і "що більше журналів видавців ми приймаємо, то більше проявляється ця закономірність".

Протокол robots.txt був створений у середині дев'яностих років, щоб захистити сайти від перевантажень через пошукових роботів. Чіткого механізму правового примусу дотримуватися директив файлу не існує, але історично їх дотримувалися добровільно. Нещодавно robots.txt став основним інструментом, який видавці використовували, щоб не допустити безкоштовного включення їхнього контенту до масиву даних для генеративного ШІ. Цей контент використовується як для навчання ШІ, так і для створення зведень інформації на його основі в режимі реального часу.

Деякі видавці, включно з New York Times, намагаються засудити розробників ШІ за порушення авторських прав у зв'язку з використанням матеріалів для цих цілей. Інші підписують із творцями ШІ ліцензійні угоди. Сторони часто розходяться в думках щодо цінності матеріалів - деякі розробники навіть стверджують, що не порушують законів, отримуючи доступ до матеріалів ЗМІ безкоштовно.

Джерело: SmartPhone.ua


Обговорення новини

Коментариев пока никто не оставил. Станьте первым!
:)8-):cry:=-):-D:angry::-[:(:devil:,)
укажите цифры с картинки
 

Попередні новини

  • Шахраї дедалі частіше використовують ШІ для фішингу та крадіжки грошейШахраї дедалі частіше використовують ШІ для фішингу та крадіжки грошей12:45 23.06.2024

    Дослідження показали, що шахраї дедалі частіше застосовують технології штучного інтелекту (ШІ) для скоєння злочинів і обходу систем захисту. Зокрема, ChatGPT і йому подібні чат-боти дають змогу генерувати більш правдоподібні та грамотні тексти для фішингових листів.

  • Передзамовлення на Vivobook S 15 – перший ноутбук Copilot+ PC від ASUSПередзамовлення на Vivobook S 15 – перший ноутбук Copilot+ PC від ASUS17:45 18.06.2024

    Компанія ASUS оголошує про початок попереднього замовлення в Україні нового покоління комп’ютерів зі штучним інтелектом (ШІ) – ноутбука ASUS Vivobook S 15 (S5507), який працює на основі процесорної платформи Snapdragon® X Elite.

  • Apple інтегрує безкоштовний ChatGPT в iPhone, iPad і MacApple інтегрує безкоштовний ChatGPT в iPhone, iPad і Mac01:54 11.06.2024

    Компанія Apple оголосила в рамках своєї презентації на WWDC 2024 про співпрацю з OpenAI. У рамках цієї взаємодії можливості чат-бота ChatGPT будуть інтегровані в голосового помічника Siri, а також в інші інструменти iOS та інших платформ Apple.


купить телефон в Одесі, Україна