AI-компании превратились в ненасытные к данным организации, поскольку их модели требуют всё более крупных наборов информации для обучения. Чтобы удовлетворить этот спрос, многие стартапы игнорируют давние интернет-конвенции, например, файлы robots.txt, которые указывают автоматическим сканерам, какие части сайта запрещены для сбора, и агрессивно собирают данные. Это вынуждает сайты ограничивать доступ к своей информации, а в некоторых случаях — заключать лицензионные соглашения с AI-компаниями. Фитнес- и социальная платформа для бегунов Strava делает шаг в этом направлении, ограничивая доступ к своему сайту и вводя плату для разработчиков.
Защита данных и платный доступ
Чтобы остановить сбор данных, компания усиливает безопасность своего веб-сайта. Теперь для просмотра определённой информации, такой как публичные профили и списки фитнес-клубов, потребуется авторизация. Ранее эти данные были доступны без входа в аккаунт.
Что касается API, ранее разработчики могли начинать создавать приложения на Strava через бесплатную программу с поэтапным доступом. Теперь компания вводит единую ежемесячную плату в размере 11,99 долларов для всех разработчиков, отметив, что цена может варьироваться в зависимости от региона.
Растущее сообщество и новые ограничения
Strava сообщила, что её сообщество разработчиков выросло с 185 000 участников в прошлом году до 241 000 в этом, и компания планирует продолжать их поддерживать. В рамках этого Strava также планирует добавить поддержку Model Context Protocol (MCP) — нового стандарта, позволяющего AI-ассистентам и приложениям получать доступ к внешним данным структурированным образом, что даёт Strava больше контроля над тем, что именно и как передаётся.
Одновременно компания планирует отключить некоторые конечные точки API — отдельные точки доступа, которые позволяли сторонним приложениям получать определённые данные, например, информацию о клубах. Это делается для защиты данных пользователей. Ранее, в 2024 году, Strava уже ужесточила правила использования API, запретив его применение для обучения AI и ограничив возможность сторонних приложений отображать данные других пользователей. Эти изменения вызвали негативную реакцию разработчиков, чьи приложения оказались под угрозой.
Хотя некоторые разработчики могут согласиться с платной подпиской, отключение определённых API-интерфейсов всё равно может повлиять на зависимые приложения. Strava предоставляет разработчикам 90-дневный льготный период перед введением этих изменений.
Борьба с агрессивным сбором данных
В интервью генеральный директор Strava Майкл Мартин заявил, что неконтролируемый сбор данных AI-компаниями может стать похоронным звоном для публичного интернета.
«AI-компании безжалостно собирают данные с публичных сайтов из-за их бесконечной потребности в обучающих данных, что ухудшает производительность сайтов в целом, — сказал Мартин. — У нас было несколько случаев за последние месяцы, когда производительность снижалась, а в некоторых случаях нарушалась. Помимо сбора данных с публичных сайтов, они также пытаются использовать наш API для доступа к нашим данным, игнорируя условия его использования».
Он отметил, что Strava отклонила предложения ведущих AI-лабораторий о заключении лицензионных сделок на данные. Мартин отдельно упомянул стартап Perplexity, заявив, что эта AI-поисковая компания направляла сбор данных через агрегаторные сервисы, чтобы скрыть своё происхождение, несмотря на отказ. Это согласуется с предыдущими обвинениями Perplexity в аналогичном поведении.
Мартин также указал на перегрузку серверов из-за плохо написанных приложений, вызовы API которых часто неэффективно структурированы и создают непропорциональную нагрузку на системы Strava.
Контекст перед IPO и отличие от Reddit
Время этих изменений, вероятно, не случайно. Strava подала заявку на IPO в этом году, и её шаги по защите данных могут быть призваны продемонстрировать дисциплину в обращении с данными потенциальным инвесторам.
Мартин быстро провёл сравнение с ужесточением доступа к API в Reddit в 2024 году. В отличие от Reddit, который установил цену доступа к API в зависимости от количества вызовов (сделав его недоступным для многих разработчиков), Strava делает ставку на фиксированную плату, чтобы сохранить экосистему разработчиков.
«Мы хотим, чтобы пользователи чувствовали, что владеют своими данными, и были уверены в том, как мы их контролируем и защищаем. Но мы также хотим, чтобы разработчики продолжали процветать и развиваться», — заявил Мартин.



