Об этом же в других СМИ

habr.com / 1 год назад

Вышла новая сертифицированная ФСТЭК версия Deckhouse Kubernetes Platform с mTLS и приоритизацией нагрузки

habr.com / 1 год назад

Из-за ошибки нагрузка на процессор при наборе текста в Outlook возрастает до 50%: временное решение проблемы

habr.com / 1 год назад

DeepSeek запатентовал технологию снижения нагрузки на сеть при сборе данных

habr.com / 1 год назад

«Астра» выпустила аналог балансировщиков нагрузки Citrix и F5

habr.com / 1 год назад

Более 150 беспрецедентных климатических катастроф обрушились на мир в 2024 году

Больше по теме

07.04.2025 - 06:38 / habr.com

Wikimedia сталкивается с беспрецедентной нагрузкой из-за скраперов AI

Фонд Викимедиа, головная организация Википедии и около десятка других краудсорсинговых проектов по сбору знаний, заявил в среду, что потребление полосы пропускания для загрузки мультимедиа с Wikimedia Commons выросло на 50% с января 2024 года. Как написала компания в своем блоге во вторник, причина кроется не в растущем спросе со стороны жаждущих знаний людей, а в автоматизированных, жадных до данных скраперах, стремящихся обучать модели AI.

«Наша инфраструктура создана для того, чтобы выдерживать внезапные всплески трафика от людей во время мероприятий, представляющих большой интерес, но объем трафика, генерируемого ботами-скрейперами, беспрецедентен и представляет собой растущие риски и издержки», — говорится в сообщении.

Wikimedia Commons — это свободно доступное хранилище изображений, видео и аудиофайлов, которые доступны по открытым лицензиям или иным образом находятся в общественном достоянии.

Если копнуть глубже, то Wikimedia сообщает, что почти две трети (65%) самого «дорогого» трафика — то есть самого ресурсоемкого с точки зрения типа потребляемого контента — были получены от ботов. Однако только 35% от общего числа просмотров страниц приходятся на этих ботов. Причина этого несоответствия, по данным Wikimedia, заключается в том, что часто используемый контент остается ближе к пользователю в его кэше, в то время как другой, менее часто используемый контент, хранится дальше в «основном центре обработки данных», обслуживание контента из которого обходится дороже. Это тот тип контента, который обычно ищут боты.

«В то время как читатели склонны сосредотачиваться на конкретных — часто схожих — темах, поисковые роботы склонны «массово читать» большее количество страниц и посещать также менее популярные страницы», — пишет

технологии люди экономика общество самит dilnaz04

Читать на habr.com

Все новости от habr.com

Об этом же в других СМИ

Российские IT‑компании сталкиваются с юридическими сложностями при выходе на IPO habr.com / 1 год назад

Wikimedia Foundation подала в суд на Роскомнадзор и Генпрокуратуру из‑за блокировки статей в «Википедии» habr.com / 2 года назад

Фонд Wikimedia Foundation подал в суд на Генпрокуратуру и Роскомнадзор svoboda.org / 3 года назад

Сайт vsenovosti.life - агрегатор новостей из открытых источников. Источник указан в начале и в конце анонса. Вы можете пожаловаться на новость, если находите её недостоверной.

06.06 / 05:22

Nvidia самит Colorful начала отгрузку видеокарт GeForce RTX 3060 с 12 ГБ памяти на китайский рынок

Согласно сообщению Board Channels, компания Colorful начала пополнение запасов видеокарт GeForce RTX 3060 12GB в Китае. В сообщении утверждается, что серия от Colorful поступила в продажу, и в числе доступных моделей указана Battle Axe GeForce RTX 3060 DUO 12GB V2.

06.06 / 05:10

технологии здоровье золото история общество Умное кольцо с экраном и вибрацией: Rogbid представила необычную модель SR15 Ultra

Компания Rogbid решила отойти от привычной концепции и представила новую модель SR15 Ultra, получившую встроенный экран и вибромотор для уведомлений.

06.06 / 04:46

люди общество самит расследование Cisco ИИ против ИИ: Cisco готовит корпорации к кибервойне машинного масштаба

2 июня на конференции Cisco Live компания Cisco представила Cloud Control — единую платформу, где люди и ИИ-агенты вместе управляют корпоративной IT-инфраструктурой и защищают ее. Логика простая: если атаки все чаще ведут рои ИИ-агентов, действующих за хакеров-людей, то и обороняться нужно агентами. "Делать все в человеческом масштабе уже нельзя, это должен быть машинный масштаб", — объяснил Reuters старший вице-президент Cisco Ди-Джей Сампат. Платформа уже доступна в США в режиме ограниченного запуска, глобальный выход — позже.

06.06 / 04:35

бизнес продукты экономика общество самит OpenAI запустила новые инструменты Codex для офисных работников

OpenAI выпустила новый набор опций для Codex, призванный расширить возможности использования этого инструмента в рабочей среде.

06.06 / 03:59

технологии google Выпуск обновления открытого просмотрщика изображений QuickView 6.2.10 для Windows 10/11

1 июня 2026 года состоялся выпуск обновления открытого просмотрщика изображений QuickView 6.2.10 для Windows 10/11. Решение поддерживает форматы WebP, AVIF, JPEG XL, PNG, JPEG, TIFF, RAW и PSD, что делает его удобным для фотографов, дизайнеров и обычных пользователей, имеет плавную навигацию, инструменты для работы с метаданными и работает без необходимости установки пакетов в системе. Исходный код проекта написан на C++ и опубликован на GitHub под лицензией GNU General Public License v3.0. Предыдущая стабильная сборка проекта QuickView 5.3.0 вышла в апреле 2026 года.

06.06 / 01:47

технологии конференция google В Chrome Canary заметили функцию автоматического перехода в AI Mode вместо результатов поиска Google

В тестовой версии браузера Chrome Canary пользователи заметили новую скрытую функцию, которая могла автоматически перенаправлять поисковые запросы в AI Mode вместо обычной страницы результатов Google. Однако в компании заверили, что это произошло по ошибке и не является частью будущих планов.

06.06 / 01:21

связь ученые история самит Знаменитости Древняя элита – раскрыт секрет 5400-летней усыпальницы купца

Полное растворение скелетных останков усложнило проведение стандартной антропологической экспертизы ДНК.

06.06 / 00:50

технологии google Nano gemini Google закрывает Pixel Studio: приложение для генерации изображений ИИ существовало менее двух лет

Компания Google окончательно прекращает работу приложения Pixel Studio — фирменного сервиса для создания изображений с помощью искусственного интеллекта. Приложение дебютировало в 2024 году вместе со смартфоном Google Pixel 9.

06.06 / 00:50

люди общество книги психология психика Пять фраз, которые мы считаем похвалой, но они жутко оскорбляют

Правильный комплимент укрепляет доверие и поднимает самооценку. Чтобы сделать человеку приятно, важно избегать двусмысленности, фальши и критики.

05.06 / 23:21

связь ученые общество самит человек Малоизвестные факты о мозге назвали ученые

Исследователи рассказали о об особенностях мозга, которые влияют на память, эмоции и поведение человека.

Лента новостей

На главную страницу