Плагин Caveman сокращает ответы ИИ и экономит токены

Разработчики чат-ботов начали внедрять инструмент Caveman, который заставляет языковые модели отвечать предельно кратко и убирать из текста все необязательные слова.


Задача утилиты проста: снизить расходы на токены в корпоративных сервисах, где лишняя вежливость и длинные формулировки быстро превращаются в заметную статью затрат.


По данным 404 Media, Caveman уже используют сотрудники OpenAI, Nvidia, GitHub и агентства DEPT.


Caveman создал разработчик Джулиус Брюсси.


Он обратил внимание на типичную проблему корпоративного ИИ:


модель часто тратит токены не на код, команды или фактический ответ, а на вводные конструкции, приветствия и связки.


Плагин вырезает этот слой и оставляет сухой результат в стиле «пещерного человека».


Для программистских сценариев это особенно заметно, потому что пользователю нужен не литературный абзац, а рабочий фрагмент кода или точная команда.


По тестам автора, в Claude и Codex инструмент сокращает объём выходного текста на 65—75 %.


Для бизнеса это прямая экономия, потому что большинство коммерческих ИИ-сервисов тарифицируют ввод и вывод по числу токенов, а у продвинутых моделей цена длинного ответа обычно выше, чем у короткого.


Отдельно Брюсси выпустил Caveman как автономного агента для терминала.


В таком режиме, по его данным, расход токенов почти вдвое ниже при сопоставимых задачах.


Проект быстро получил поддержку от самих игроков рынка.


В репозитории GitHub зафиксированы правки от технического директора OpenAI Шейна Суини, который добавил поддержку Codex.


Это редкий случай, когда поставщик модели помогает инструменту, уменьшающему потребление его же продукта.


Объяснение простое:


корпоративные клиенты охотнее масштабируют ИИ, если могут предсказуемо считать бюджет.


Caveman и экономика токенов История с Caveman выросла из более широкой тенденции.


Крупные компании уже вводят лимиты на использование генеративного ИИ сотрудниками, когда расходы начинают расти быстрее, чем реальная отдача от экспериментов.


В источнике в качестве примеров упоминаются Uber, Walmart и производитель электрооборудования Legrand, который в служебных рекомендациях советовал сокращать объём ответов и реже включать самые дорогие модели.


Проблема касается не только числа запросов, но и привычек пользователей.


Глава OpenAI Сэм Альтман ранее говорил, что даже слова вроде «пожалуйста» и «спасибо» в промптах обходятся компании в десятки миллионов долларов дополнительных затрат на электроэнергию.


Для обычного пользователя это выглядит как мелочь.


Для сервиса с миллиардами запросов в месяц это уже инфраструктурный вопрос.


Вокруг этой темы быстро формируется отдельный слой услуг.


Accenture уже продаёт клиентам консультации по токеномике, то есть по управлению стоимостью запросов, выбору моделей и допустимой длине ответов.


Схожие инструменты появились и в разработке:


GitHub Copilot, Cursor и другие кодовые ассистенты разделяют модели по цене и скорости, а часть функций выносят в «премиальные» лимиты.


Иными словами, рынок движется к той же логике, что и облачные вычисления: сначала компании считают удобство, затем начинают считать каждый запрос.


У Caveman есть и практическое ограничение.


Чем сильнее сжатие, тем выше риск потерять нюанс, который нужен в юридических, медицинских или клиентских сценариях.


Для кода, DevOps-команд и внутренних техподсказок такой формат подходит лучше.


Для поддержки клиентов, где важны тон и объяснение, экономия токенов может столкнуться с падением качества ответа.


Рынок генеративного ИИ в корпоративном сегменте всё заметнее делится на два слоя: самые мощные модели для редких сложных задач и дешёвые режимы для массовой рутины.


Если инструменты вроде Caveman закрепятся в экосистемах OpenAI, Anthropic и GitHub, следующим шагом станет встроенное управление «многословием» на уровне самих моделей.


Ответ на это компании, вероятно, дадут в ближайших обновлениях корпоративных тарифов, где экономия на выходных токенах уже превращается в продаваемую функцию.


Плагин Caveman сокращает ответы ИИ и экономит токены

Сообщает itzine.ru

 

Опубликовано: 04:00, 01.07.2026

 

Новость из рубрики: Политика

 

Поделиться новостью: Поделиться новостью в Facebook Поделиться новостью в Twittere Поделиться новостью в VK Поделиться новостью в Pinterest Поделиться новостью в Reddit

 
 

В VS Code нашли 0-day-уязвимость, позволявшую похищать токены GitHub 19:00, 05 Июн В VS Code нашли 0-day-уязвимость, позволявшую похищать токены GitHub ИБ-исследователь Аммар Аскар (Ammar Askar) выложил в открытый доступ PoC-эксплоит и детали 0-day-уязвимости в Visual Studio Code, которая позволяет п...

Токены для аутентификации и ЭП: передовые модели, тенденции рынка и особенности выбора 20:00, 21 Апр Токены для аутентификации и ЭП: передовые модели, тенденции рынка и особенности выбора В начале декабря Компания «Актив» начала выпуск модернизированной линейки устройств Рутокен ЭЦП 3.0 с поддержкой технологии бесконтактной электронной...

Современное сельское хозяйство стремительно переходит от традиционных методов к цифровым технологиям, где ключевую роль играет точное земледелие 11:18, 05 Май Современное сельское хозяйство стремительно переходит от традиционных методов к цифровым технологиям, где ключевую роль играет точное земледелие Современное сельское хозяйство стремительно переходит от традиционных методов к цифровым технологиям, где ключевую роль играет точное земледелие. Это...

Топовые компании тратят на токены ИИ больше, чем на фонд оплаты труда 20:00, 13 Июн Топовые компании тратят на токены ИИ больше, чем на фонд оплаты труда Несмотря на громкие заявления о том, что вычисления дороже людей, исследование Ramp AI Index показывает иную картину. Самые активные компании тратят ...

Microsoft перевела GitHub Copilot с подписки на оплату за токены  пользователи недовольны 21:00, 31 Май Microsoft перевела GitHub Copilot с подписки на оплату за токены — пользователи недовольны Похоже, что в ближайшее время мелким компаниям придётся пересмотреть целесообразность использования сервиса GitHub Copilot. Дело в том, что Microsoft...

Инструмент анализа данных на Python на полдня стал вредоносным  он крал ключи и токены 12:00, 02 Май Инструмент анализа данных на Python на полдня стал вредоносным — он крал ключи и токены Неизвестный киберпреступник загрузил на платформу PyPI модифицированную версию 0.23.3 утилиты elementary-data, предназначенной для мониторинга информ...

Ответы на ЕГЭ из сети, почему это невозможно 05:00, 20 Май Ответы на ЕГЭ из сети, почему это невозможно Рособрнадзор в преддверии Единых госэкзаменов предостерег одиннадцатиклассников от покупки ответов в интернете. В ведомстве обосновали, почему это не...

Избирательная щедрость: Ролан Гаррос экономит на игроках и инвестирует в нейросети 04:00, 24 Май Избирательная щедрость: «Ролан Гаррос» экономит на игроках и инвестирует в нейросети Стартовавший в Париже «Ролан Гаррос»-2026 рискует стать точкой масштабного институционального раскола в мировом теннисе. На фоне рекордного призового...

22:00, 21 Июн Магазины и кафе — пока светло, уличное освещение — нет: Севастополь экономит В Севастополе вводят ограничения потребления электроэнергии, чтобы уложиться в лимиты после масштабных отключений утром в воскресенье. Также посла ат...

18:00, 22 Апр Ответы для ЕГЭ, ОГЭ и олимпиад приравняют к пропаганде суицида Власти собираются запретить распространение ответов на задания государственных экзаменов, федеральных учебников и Всероссийской олимпиады школьников....

03:00, 04 Июн Так уже никто не экономит: почему отключение Bluetooth приводит к потере преимуществ гаджета Владельцы смартфонов часто выключают Wi-Fi и Bluetooth, надеясь продлить жизнь аккумулятора. Метод кажется логичным, но на деле дает мизерный эффект....

01:00, 04 Июн Мошенники предлагают школьникам купить готовые ответы на ЕГЭ Злоумышленники в мессенджерах предлагают выпускникам приобрести готовые ответы на экзамены, однако после оплаты либо исчезают, либо получают доступ к...

07:00, 14 Май Что пермякам не нравится в своей внешности: откровенные ответы Жители столицы Прикамья чаще всего беспокоятся из-за состояния кожи лица и лишнего веса. Читать далее...

05:00, 01 Июл Первый в мире тепловой насос 9-в-1 управляет энергетикой дома и экономит прорву денег Формально это тепловой насос — прибор, обогревающий дом. По сути же он управляет не только теплом, но и всеми другими потоками энергии в доме. Чтобы ...

02:00, 16 Май Google начнёт наказывать сайты за накрутку попаданий в ИИ-ответы Компания Google обновила правила в отношении спама в поиске. Теперь попытки издателей сайтов повлиять на появления их ресурсов в сводках от искусстве...

18:00, 03 Июн Песков: В МИД же сказали — наши ответы носят системный характер Ответ ВС РФ на удары ВСУ будет системным, и он уже начался. Так прокомментировал журналистам отсутствие реакции на атаку дронов на Санкт-Петербург пр...

00:00, 14 Июн Один режим экономит не только заряд: зачем пассажиров просят отключать связь в полёте Требование перевести смартфон в авиарежим остается базовым ритуалом перед взлетом. Несмотря на развитие электроники, мобильные устройства способны вл...

19:00, 29 Июн British American Tobacco сократит 9 тысяч человек по всему миру. Компания экономит £600 миллионов Британский производитель табачных изделий British American Tobacco объявил о масштабной реструктуризации. Под сокращение попадут 9 тысяч сотрудников ...

08:00, 29 Июн Гипсокартонный короб в ванной экономит деньги, но не нервы: есть способ спрятать трубы практичнее Каждый, кто ремонтировал ванную комнату, сталкивался с дилеммой: как скрыть трубы, сохранив при этом доступность. Традиционный подход предполагает за...

13:00, 02 Май Как бизнесу попасть в ответы Gemini, ChatGPT, Perplexity и других нейросетей Еще недавно главной задачей поискового продвижения было попасть в ТОП-10 Google. Но сегодня этого уже недостаточно: пользовательский сценарий поиска ...

11:00, 15 Июн FT: новостная служба «Би-би-си» сокращает сотни сотрудников «Би-би-си» сократит несколько сотен сотрудников новостной службы. Об этом сообщает Financial Times (FT) со ссылкой на источники....

05:00, 06 Май «СберЗдоровье» сокращает путь пациента к выздоровлению Медицинская компания «СберЗдоровье» запустила функцию «План подготовки к приему». Теперь после записи к врачу......

02:00, 16 Май Truecaller сокращает 15% персонала из-за падения рекламных доходов Шведская компания Truecaller уволила 70 сотрудников на фоне 27-процентного падения выручки и 44-процентного снижения доходов от рекламы, вызванного з...

12:00, 05 Май «Мне только спросить»: где в интернете россияне ищут ответы на бытовые вопросы. Исследование Rambler&Co Треть используют ИИ для упрощения полученной информации. К 2026 году тематические новости, полезный контент и подборки читают не только по прямым зах...

18:00, 07 Май ChatGPT перешел на GPT-5.5 Instant — OpenAI обещает меньше ошибок и более точные ответы OpenAI начала внедрение новой модели GPT-5.5 Instant в ChatGPT. Именно она теперь станет моделью по умолчанию вместо GPT-5.3 Instant. Компания заявля...

20:00, 27 Май Турция сокращает импорт российской нефти марки Urals ... График нефти Urals Согласно данным LSEG, Kpler и торговым источникам, Турция планирует сократить импорт российской нефти марки Urals из портов Балтий...

20:00, 20 Май Google запустил ИИ-поиск в YouTube: ответы на сложные вопросы, включая короткие и длинные ролики YouTube также внедряет Gemini OmniКоманда Google обновила поисковую систему на платформе YouTube, добавив функцию Ask YouTube, которая позволяет зада...

05:00, 25 Апр В ПНИПУ выяснили, что вмятина от птицы сокращает ресурс детали самолёта в 14 раз Учёные Пермского Политеха выяснили, что вмятины от ударов птиц, града или камней на деталях из стеклопластика всерьёз снижают их ресурс. Если целая д...

22:00, 20 Апр Таиланд сокращает длительность безвизового режима до 30 дней для борьбы с преступностью Таиланд сокращает продолжительность безвизового режима с 60 до 30 дней для борьбы с онлайн-мошенничеством. Об этом заявил вице-премьер и глава МИД Та...

02:00, 20 Май Таиланд сокращает безвизовый срок для россиян: новые правила въезда Таиланд закрывает дверь перед "вечными" туристами. Правительство страны решило сократить срок безвизового пребывания для россиян и граждан других гос...

17:00, 04 Май Почему вращение Земли не сокращает время полёта и при чём здесь плоская Земля Почему самолёты не летят быстрее из-за вращения Земли: разъясняем популярный миф Земля крутится под нами со скоростью больше полутора тысяч километро...

06:00, 09 Май Австралия выделила более миллиарда долларов на помощь Киеву, но сокращает траты Австралия с 2022 года направила на поддержку Украины более 1,7 млрд австралийских долларов — это около 1,2 млрд долларов США. Об этом в интервью РИА ...

02:00, 12 Июн Пока Германия сокращает бюджетные расходы, в банках тихо лежат миллиарды евро На забытых счетах в банках Германии лежат миллиарды евро, пишет DW❶❷. Пока в стране сокращают бюджетные расходы, в банках и в других финучреждениях т...

01:00, 29 Июн Lucid Motors сокращает 18% персонала для экономии ресурсов перед выпуском доступного электромобиля Новый глава Lucid Motors Сильвио Наполи инициировал масштабную реструктуризацию, затронувшую около 1500 сотрудников. Меры по оптимизации направлены н...

09:00, 06 Май Fractal EMS сокращает цены и оптимизирует контракты, чтобы помочь разработчикам двигаться быстрее Компания Fractal EMS, лидер на рынке передовых солнечных систем, BESS,... Сообщение Fractal EMS сокращает цены и оптимизирует контракты, чтобы помочь...

20:00, 30 Июн Поставки в ограненном объеме // Россия сокращает добычу и экспорт алмазов активнее конкурентов Россия, занимающая первое место по производству алмазов в мире, сократила добычу в 2025 году на 15,5%, а экспорт в каратах — на 2%. Алмазодобывающие ...

16:00, 19 Апр Samsung ускорится в два раза. Компания сокращает цикл разработки новых стандартов памяти HBM всего до одного года Каждый год всё более быстрая памятьКомпания Samsung решила сократить цикл разработки новых стандартов памяти HBM, причём сразу вдвое: с двух лет до о...

11:00, 11 Июн Высокоскоростной спутниковый интернет с низкой задержкой сокращает разрыв в цифровой грамотности: Starlink подключил к Сети удалённые школы Кении 30 школ и более 32 000 учеников впервые получили стабильный доступ в сетьВ странах Глобального Юга доступ к интернету остаётся ограниченным. В регион...