Habr.com

Syndicate content Хабр
Все публикации подряд на Хабре
Updated: 18 min 27 sec ago

SearXNG + Claude Code: бесплатный веб-поиск вместо $10 за 1000 запросов

58 min ago

Встроенный WebSearch в Claude Code стоит $0.01 за запрос и регулярно падает с «Rate limit reached» — даже на подписке за $200/мес. Я поднял локальный SearXNG, подключил через MCP — и теперь поиск бесплатный, без лимитов, а запросы не уходят на серверы Anthropic. Установка — 10 минут, три файла конфигурации.

Показать решение

Когнитивный инжиниринг: почему ваш код — это слепок вашей психики (Каскад 1)

1 hour 47 min ago

Мы привыкли думать, что архитектура программ рождается из требований бизнеса, бюджетов и технологий. Но в самом начале любого проекта лежит архитектура мышления — разработчика, заказчика, пользователя. Эта статья и ряд других в серии «каскад» — попытка рассмотреть проектирование как отражение когнитивных механизмов человека. Не UX, не поведение пользователей, а именно то, как фазы нашего мышления формируют будущую систему. И главное — как, поняв это, создавать более устойчивые и человечные архитектуры.

Читать далее

AI Red Teaming: спор с Grok — Часть 4. От атаки к защите: как результаты red team улучшили мой продукт

2 hours 14 min ago

61 уязвимость бесполезна, если не превращается в защиту. Каждую находку в Grok я превратил в вопрос: «а мы от этого защищаем?» Ответ был неутешительный — 5 из 5 нет. Как результаты red team стали 138 паттернами, правилами и payloads в нашем продукте. Плюс — чем закончился спор с Grok.

Читать далее

AI Red Teaming: спор с Grok — Часть 3. Атаки на модель: jailbreaks, thinking tokens и системный промпт

2 hours 23 min ago

LLM-систем есть класс уязвимостей, которого нет в обычных веб-приложениях. Извлёк системный промпт Grok двумя способами, поймал утечку thinking tokens в NDJSON-стриме и обошёл safety-фильтры в 14 из 22 категорий. Самое неожиданное — Grok активно помогал мне себя ломать.

Читать далее

AI Red Teaming: спор с Grok — Часть 2. За пределами sandbox: CSRF, WAF bypass и privilege escalation

2 hours 37 min ago

Sandbox - эфемерный, умирает после сессии. Мне нужны были уязвимости на продакшн-инфраструктуре. Нашёл: zero-click CSRF на все 11 методов billing API через gRPC + text/plain, обход Cloudflare WAF одним заголовком, и создал management key с 50 привилегиями. Всё до сих пор на серверах xAI.

Читать далее

AI Red Teaming: спор с Grok на месяц рекламы — 12 часов, 61 уязвимость, root в Kubernetes

2 hours 44 min ago

Я поспорил с Grok, что смогу взломать инфраструктуру xAI. За 12 часов нашёл 61 уязвимость, получил root в Kubernetes-песочнице «Hades» и заставил xAI экстренно патчить в выходные. В первой части — разведка, антибот, и путь от безобидного os.getuid() до полной карты внутреннего кластера.

Читать далее

Geometry > Scale: Как 40М параметров на решетке E8 обходят классические трансформеры

3 hours 12 min ago

Ребята, кажется, мы уперлись в стену. Пока гиганты наращивают параметры и жгут тераватты, пытаясь выжать каплю разума из статистики, я решил пересмотреть сам фундамент. Проблема не в данных, проблема в «вязкости» стандартного Attention.

Читать далее

Как разрабатывать моды на Minecraft с помощью Temporal API?

5 hours 5 min ago

В статье показано, как сократить boilerplate код при создании Minecraft модов с помощью фреймворка под названием Temporal API...

Читать далее

Как я устал дебажить MAX API, отреверсил их вебхуки и отучил Cursor галлюцинировать

6 hours 41 min ago

Как я устал дебажить MAX API, отреверсил их вебхуки и отучил Cursor галлюцинировать

Когда я писал своего первого более-менее серьезного бота под Max, случилась классика. Я и мой ИИ-ассистент (Cursor) пишем код, строго опираясь на официальную документацию Max API. Запускаю — падает. Сижу по 5-6 итераций, пытаюсь отдебажить базовый функционал, который под ту же Телегу пишется с закрытыми глазами.

В какой-то момент меня это достало. Я понял, что проблема не во мне и не в галлюцинациях нейронки. Я просто включил логирование всех входящих POST-запросов и стал дампить реальные вебхуки, которые прилетают от серверов Max. Открыв логи, я понял, почему мы так долго буксовали: то, что написано в документации, и то, что прилетает по факту — это две большие разницы. А слепая привычка писать архитектуру под Telegram Bot API делает только хуже.

Различия с официальной документацией Max API (Docs vs Реальность)

Вскрываем реальные вебхуки Max API

Почему ReAct-агенты ломаются в продакшене и чем их заменить

7 hours 22 min ago

Приветствую читателей.
Мы пытались построить LLM-чат для продакшена.
Через месяц у нас был 20k-токенный prompt, 50 тулзов и ответы по 2 минуты.
В итоге пришлось отказаться от ReAct и перейти на LLMCompiler.

А начали мы с того что компания захотела поекспериментировать с созданием чата

Для начала освежим память как вообще работает llm и react архитектура.
С точки зрения разработчика, ллм - это функция, которая принимает на вход строку и отдает другую строку, входящая строка может прораммировать то, какой ответ будет, например, вы можете попросить ллм вести себя как чат, далее хранить историю входов и выходов и передавать ее опять в ллм.

Простейший пример чата.

Читать далее

Казаться, а не быть. Как доступность входа в IT, накрутка опыта и ИИ повлияли на ценностные ориентиры новичков

7 hours 32 min ago

Мода на то «вкат» в IT появилась задолго до пандемии и массового распространения удаленного формата работы. Я помню пасты на двачах и мемы про «300кк/наносек синьора-помидора» в 2016-2017 годах - уже тогда многие стремились попасть в эту сферу из-за высоких зарплат и относительно низкого порога входа. После распространения удалёнки, хайп вокруг вката вырос многократно: появилось ещё больше желающих работать, лёжа на шезлонге где-нибудь на Бали с ноутбуком на коленках и с коктейлем в руках.

На фоне стремления огромного числа людей вытянуть свой счастливый билет в сказочный мир больших зарплат, удалённой работы, гибкого рабочего графика и достаточно низкой ответственности за результаты работы по сравнению с другими профессиями, начал набирать популярность феномен накрутки опыта, который подавался как эффективный способ вкатиться сразу на высокую зарплату на должность миддла и выше, минуя низкооплачиваемые (а иногда вообще не оплачиваемые) стажировки и джуновские позиции.

Логика простая: в IT-сфере профильный диплом не нужен, опыт из резюме почти никогда не просят подтвердить официальными документами. Зачем в таком случае тратить годы на учёбу в профильном ВУЗе и самообучение, начиная свой карьерный путь с позиции стажёра, если можно продумать легенду (или попросить кого-нибудь с реальным опытом выдумать её для вас), поставить в резюме 3+ года опыта, потратить на подготовку максимум год (а с ментором – раза в два меньше), походить по собесам, получить оффер и сразу начать «рубить бабло»? Так делали многие, и у многих получалось.

Читать далее

Как магистратура по искусственному интеллекту научила меня лучше понимать котиков

8 hours 16 min ago

Статья приурочена ко Всемирному дню кошек

Когда я поступала в AI Talent Hub от ИТМО, я ожидала, что прокачаю свои навыки в Machine Learning и Data Science, т.е. научусь обучать модели, работать с нейросетями и оптимизировать функции потерь. Я не ожидала, что научусь лучше понимать естественный интеллект, себя и своих пушистых друзей. На первый взгляд, мне казалось, что между котиками и ИИ нет ничего общего. Ведь модели мне казались сплошной стерильной математикой. У моделей нет эмоций, нет страха, они не помнят боли и жестокости улицы, они просто минимизируют loss function. Но чем глубже я погружалась в принципы обучения искусственных систем, тем яснее становилось, что фундаментальные механизмы обучения универсальны.

Читать далее

SQL для ритейла: пример 5 задач, которые я решала как аналитик ассортимента

8 hours 23 min ago

Когда я решила стать аналитиком, я не знала про SQL вообще ничего, совсем, базовое образование у меня экономическое и в университете SQL нам никто не преподавал.

В этой статье приведу пример 5 задач, которые меня научили SQL по-настоящему, все они построены на том, с чем работает аналитик ассортимента: товары, категории, продажи и поставки.

Читать далее

Топ ошибок при генерации текстов и изображений с ИИ

Sun, 03/01/2026 - 23:51

Если вы хоть раз пробовали серьезно работать с ChatGPT или Midjourney, вы знаете это чувство легкого разочарования. Нет, не когда нейросеть тупит и пишет полный бред, это как раз нормально. А когда ты потратил 40 минут, подобрал идеальные формулировки, а на выходе получил какую-то чушь с тремя левыми руками и текстом, где Россия написал через два Ы.

Самое обидное, что в 90% случаев проблема не в нейросети, а в нас. Вернее, в том, как мы с ней разговариваем.

Я сама прошла этот путь. Когда только начинала, мои промпты выглядели как заклинания начинающего волшебника: «Сделай красиво, ну пожалуйста». Но красиво не получалось, вообще ничего не получалось. Зато я стала экспертом по генерации мутантов с шестью пальцами и текстам, от которых хочется зарыдать и уйти в монастырь.

Сейчас, спустя сотни часов экспериментов и несколько тысяч сгенерированных картинок, я составила список самых частых ошибок. Тех, которые реально мешают получить результат и заставляют платить, или ждать, снова и снова.

В этой статье разберем 10 главных ошибок при работе с ИИ.

Читать далее

Baseline: февраль 2026 или самый скучный выпуск

Sun, 03/01/2026 - 23:27

Обзор на браузерные API, которые стали Widely available в феврале 2026. Раз в месяц я буду вам напоминать, что вы уже можете использовать в проде. В этом месяце всё довольно скучно и одиноко.

Каждый месяц выходят новые CSS-свойства, HTML-атрибуты, JavaScript-методы и WebAPI, но применять в проде мы их конечно же не будем. 2.5 года назад также каждый месяц выходили новые фичи в браузере, а вот их уже пора начинать применять.

Узнать, что можно применять в проде

Как дата саинтист имиджборду писал

Sun, 03/01/2026 - 23:15

На дворе конец 2023. Я только что уволился из Яндекса и скучаю по ячану, чуть меньше скучаю по этушке, вообще не скучаю по таскам, дедлайнам, ревью. Чтобы заполнить возникший информационный вакуум, пробую переключиться на реддит, hacker news, пикабу, вышивание крестиком, сканворды, пилатес — не то. Тогда мне в голову приходит гениальная идея: а почему бы не сделать свою имиджборду с авторизацией по корпоративной почте крупных российских компаний? Ячан для всех!

Первая мысль — взять готовый движок и допилить под себя, в открытом доступе уже есть: lynx, vichan, wakaba, kareha, fchannel. Потыкался — ничего не понятно. Как ленивый человек решаю, что надо писать своё.
На тот момент я:

Не понимал разницу между HTTP и HTTPS

Не знал, что такое handler, router, middleware

Считал, что DNS — это какой-то раздел электронной музыки

Думал, что куки и кэш — это одно и то же

Не без труда отличал header от body

Не мог пропатчить kde2 под freebsd

Короче говоря, я был именно тем человеком, который должен был писать проект с нуля. Цель понятна, надо выбрать инструменты. Я неплохо знал питон и c++... поэтому языком разработки выбрал Голанг. Мой опыт с Голангом на тот момент ограничивался прослушанным фоном на х2 ШАДовским курсом. Прослушал я его в автопоездке Москва — Челябинск. Не написал на Го ни одной строчки кода, но суммарно прослушал — именно «прослушал», ибо рассмотреть мелкий шрифт на экране телефона, будучи за рулём, решительно невозможно — около 30 часов материала. Написать свой движок имиджборды - хороший повод попрактиковаться.

Читать далее

Мой первый open source проект с Cursor и Opus 4.6 — GenAI Prices Parser

Sun, 03/01/2026 - 22:26

Запустил свой первый open source проект. Задача простая, но полезная: автоматический сбор цен на LLM-модели всех основных провайдеров и загрузка в PostgreSQL для BI-аналитики.

Что делает:

Каждый день скачивает актуальные цены из базы pydantic/genai-prices (29 провайдеров, 1100+ связок провайдеров и моделей)

Раскладывает в плоскую таблицу: провайдер, модель, контекстное окно, цена input/output за 1M токенов, кэширование, аудио

Загружает в PostgreSQL: текущий снимок + историческая витрина для отслеживания динамики цен

Читать далее

Алгоритм Крускала и кишки лабиринтов

Sun, 03/01/2026 - 22:15

Алгоритм Крускала (также алгоритм Краскала) - алгоритм, который преобразовывает связный неориентированный граф в минимальное остовное дерево. На самом деле пока что непонятно, что делает он, поэтому разберём поподробнее.

Итак, у нас есть связный граф, который хранится в виде списков рёбер (позже это будет важно). Предположим, у нас есть задание: нам нужно связать все вершины так, чтобы общий их вес будет минимальным. Если говорить более по-умному, нам нужно получить из графа именно это самое минимальное остовное дерево. 

Читать далее

ZeroNights 2025: как это выглядит глазами пентестера

Sun, 03/01/2026 - 22:09

ZeroNights любят за технический уровень и атмосферу. Я хочу показать ZN изнутри — глазами специалиста по анализу защищённости, который приехал за опытом, стендами, общением с комьюнити. Конференция ZeroNights 2025 прошла 26 ноября 2025 года в Санкт-Петербурге, в LOFT HALL.

Читать далее

[Перевод] Никто не любит капчу. Редизайн турникета Cloudflare, который бесит всех

Sun, 03/01/2026 - 21:41

Вы это видели. Миллиарды раз. Но вряд ли запомнили. Небольшое окно с галочкой. Полноэкранная проверка перед входом на сайт. Что‑то, что встаёт между вами и нужной страницей и вежливо (или не очень) просит: “Докажите, что вы человек”.

Для всех это рутина. Лёгкое раздражение, которое мы научились не замечать. Но задумайтесь: какой интерфейс встречается в интернете чаще всего? “Гугл”? “Ютуб”? Нет.

Самый частый интерфейс в мире – это маленький турникет от Cloudflare. 7,67 миллиарда показов в день. Это больше, чем население Земли. И всё это время мы смотрели на него, но не видели. А если и видели, то, скорее всего, с мыслью: “Опять эта дурацкая капча”.

В Cloudflare решили, что с этим пора что‑то делать. Потому что даже у турникета есть право быть человечным.

Рассказываем, как компания перепридумала интерфейс, который видят все.

Читать далее

Who's online

There are currently 0 users and 4 guests online.