Как перевести продакшен-проект на рельсы agent-driven development - когда LLM-агенты становятся полноценными участниками разработки, а не просто подсказчиками в автокомплите ? Реальный опыт на реальном проекте !
Продолжаем улучшать Feedback Loop. В предыдущей статье я ускорил прогон тестов в 6 раз. Теперь — следующий шаг: LLM-агент генерирует тесты. Два подхода (sprint-driven и coverage-driven), шестиуровневый pipeline верификации, двух-агентная архитектура, оптимизация feedback loop — и 68 тестовых файлов на выходе с acceptance rate 86.8% при ревью живыми разработчиками.
В статье — конкретика: как анализировал покрытие и свежесть документации, как ускорял компиляцию для агента, на чём экономил токены, и что сказала команда на code review.
Читать далееSimpleGen — новый продукт для генерации решений на платформе SimpleOne с помощью AI. В этой статье рассмотрим, как начать работу с SimpleGen: что поставить на рабочую машину, как подготовить репозиторий, настроить доступ к SimpleOne, а также выполнить свою первую задачу.
Читать далееНастройте своего персонального ИИ-трейдера на базе OpenClaw в Telegram — полностью бесплатно и без единой строчки кода. Агент понимает естественный язык, работает с Finam Trade API и умеет сам писать и запускать Python-скрипты прямо в чате.
В этом туториале покажем, как настроить агента с нуля, подключить к Trade API и использовать его для сканирования рынка, алгостратегий и выставления ордеров по расписанию.
«Что же ты всё по Бамбукам загоняешься? Есть и другие хорошие принтеры — и дешевле». Примерно так мне сказали, передавая на тест Anycubic Kobra 2 Pro. Ну, хорошо. Я человек открытый — дайте железо, дайте время, и я выдам честный вердикт.
Kobra 2 Pro — бедслингер с заявленным полем 220×220 мм и скоростью до 300 мм/с (маркетинговые, разумеется). На бумаге — конкурент Bambu Lab A1 Mini: стол больше, ценник ниже. Казалось бы, чистая победа Кобры. Спойлер: нет. Но обо всём по порядку.
Читать далееПривет! Если вы читаете эту статью, то скорее всего столкнулись с блокировками Telegram или просто хотите обеспечить себе стабильный и безопасный доступ к мессенджеру. Я покажу, как поднять свой собственный MTProto прокси с Fake TLS на любом VPS сервере за 5 минут с помощью готового скрипта.
Читать далееНедавно я присутствовал на рабочей встрече в налоговой инспекции, которая заставила меня кардинально переосмыслить многие вещи.
На этой встрече меня, выступающего в роли налогового консультанта, и находившегося рядом со мной руководителя проверяемой компании сотрудники налогового органа буквально чуть не разорвали на части. И я абсолютно уверен, они бы довели свое дело до конца, если бы в определенный момент, устав выслушивать этот поток агрессии и угроз, мне не пришлось бы представиться и рассказать о своем прошлом месте работы.
Изначально, я не планировал этого делать, так как не видел в этом никакой необходимости. Но по ходу встречи понял, что такая необходимость есть.
Но обо всем по порядку. Дальше расскажу, как вообще рабочая встреча сотрудников налогового органа с налогоплательщиками могла скатиться до уровня уличных разборок.
Читать далееЕсли вы ранее работали с мобильным приложением DogPlanner, то вы, наверное, уже знакомы с робопёсом Роби. Но в любом случае, позвольте рассказать вам его историю. Роби живёт на Марсе... ходит молва, что он был собран кем-то из деталей первого в истории марсохода Sojourner. Он изучает красную планету, да и, по возможности, всю вселенную через сигналы, приходящие из космоса.
Читать далееЧем отличается заработок крупных денег от небольших?
А тем, что крупные деньги зарабатывают на создании проблем для пользователей. А не их решении.
— Мы провели исследование и теперь видим проблемы пользователей. Решим их, улучшим UX и платежи вырастут. — отчитывается ответственный менеджер на вопрос о продажах.
Проходит 3 месяца, руководство задает тот же вопрос. В ответ:
— Нууу, у нас зато значительно вырос NPS пользователей…
— Какой еще НПС? Вы мне обещали продажи! Нас щас тут разгонят всех как малограмотных. Вы на кого работаете? На пользователя или на компанию?
Такую логику породили всевозможные экологичные и распиаренные продуктовые фреймворки.
Когда в действительности реально большие деньги зарабатываются не на решении проблем пользователя. А на создании новых.
Сильный бизнес видит перспективу. И заранее создает пользователям проблемы, которые он для них в будущем решит. За деньги.
Возьмем тот же LinkedIn. Туда люди и так приходят с проблемами...
Читать далееВсем привет! У многих из нас куплена максимальная подписка на Google AI Ultra - правда же? Да, она стоит не копейки - по акции первые 3 месяца обходятся в $124.99/мес, а потом ценник подрастает. Но мы заставим ее отработать каждый цент.
Читать далееЯ крайне редко на фрилансе получал заказы связанные с DS/ML, специалистов для таких задач обычно ищут не там. Причины разные: они требуют долгой интеграции, заказчик сам не понимает задачу, DS более конфиденциален, DS часто возникают внутри продукта, да и в последнее время этот сегмент на фрилансе съедается при помощи LLM: AI integration, RAG боты например.
Но, внезапно, мне в личку постучались с таким проектом.
Читать далееВ марте 2022 года Atlassian объявляют об уходе из России. Сначала останавливают продажи новых лицензий, потом перестают продлевать старые.
Россияне начали искать выход. Кто-то готовил обходные пути, кто-то взламывал лицензии через генератор на GitHub, кто-то регистрировал аккаунты через зарубежные филиалы. Много компаний мигрировали на отечественные аналоги.
До ухода Atlassian большинство российских компаний работали на их продуктах. Jira была дефолтным инструментом для разработчиков, Trello уже как синоним канбан-доски, а Confluence — единственная корпоративная база знаний, которая не вызывает отвращение.
Два студента из Австралии в 2002 году взяли $10 тысяч с кредитки и создали продукты, которыми через 20 лет пользуются миллионы команд по всему миру.
Сейчас расскажу, как Atlassian стала стандартом индустрии.
Читать далееПродолжаем серию статей о нашем функциональном и удобном корпоративном портале.
Открытость — часть культуры Sminex. Своё мнение принято высказывать, устаревшие бизнес-процессы — совершенствовать и менять. Любой сотрудник может предложить идею, изменить устаревшие и неэффективные правила и технологии. И не только предложить, но и заработать, если идея соответствует определённым критериям и выгодна компании. Это отличная мотивация для команды. Для реализации на практике работает корпоративный сервис «Идеи». Раньше технической базы для него не было. Всё сводилось к отдельному почтовому ящику и группе сотрудников, координировавших процесс. Единого подхода к подаче идей тоже не было: предложения поступали в свободной форме, не всегда содержали нужную информацию и часто повторялись.
Читать далееВ 1957 году писатель-фантаст Роберт Хайнлайн так представлял себе людей XXI века: «Делала перерасчет прочности гидропонических оранжерей, но выходило с ошибками. Дважды забывала логарифмы, так что пришлось лезть в таблицу».
Однако наша цивилизация выбрала другую ветку развития — и в нашей версии XXI века все за человека делают машины: от сложения двузначных чисел до написания статей на Хабре. Считать в уме, а уж тем более помнить наизусть логарифмы — звучит, как не самая востребованная сверхспособность.
Зато, чтобы обрести эту сверхспособность, не требуются укусы радиоактивных пауков — достаточно просто прочитать эту статью, а уж пригодится ли в жизни — решайте сами. Может быть в нужный момент калькулятора под рукой не окажется, а может быть просто захочется произвести впечатление на коллег небрежно брошенной фразой: «Корень седьмой степени из пяти это примерно 1,25». Хотите научится быстро считать? Тогда добро пожаловать под кат!
Читать далееJDK 26 выходит уже совсем скоро. Тем временем в GC закрыли около 380 задач (почти в 2 раза больше, чем в прошлом релизе), но в этот раз акцент сместился с больших фич в пользу практичных доработок.
Главное для всех сборщиков: нормальный учет CPU GC. Теперь считают не только stop-the-world паузы, но и конкурентную работу и дедупликацию строк. Можно посмотреть через лог cpu=info при завершении VM, обновили Hsperf-счетчики, есть доступ из кода. Плюс новый JFR-ивент с деталями по string dedup.
JEP 516: Aot Cache стал независим от выбранного GC и опций VM. Включение через опцию -XX:+AOTStreamableObjects.
G1 получил самые заметные улучшения: JEP 522 уменьшает синхронизацию между GC и приложением (цель - увеличить throughput). Еще: целевое использование CPU G1 по умолчанию снижено с 8% до 4%, добавили важнейший флаг UseGCOverheadLimit.
Читать далееПривет, Хаброжители! Мы открыли предзаказ на книгу «Машинное обучение на табличных данных: XGBoost, глубокое обучение и ИИ» Марка Райана и Луки Массарона. Предлагаем ознакомиться с главой 3 «Машинное и глубокое обучение».
Чтобы сравнить машинное и глубокое обучение с точки зрения простоты, сопоставим два решения для конкретной задачи классификации табличных данных: прогнозирование того, будет ли объект недвижимости, предлагаемый в аренду на платформе Airbnb в Нью-Йорке (NYC), иметь цену больше или меньше средней цены в объявлениях Airbnb на этом рынке.
Читать далееВ этой статье посмотрим на модуль ACME веб‑сервера Angie. Модуль позволяет с минимальными усилиями получить TLS‑сертификаты и автоматически их обновлять. Наверняка вы уже работали с бесплатными сертификатами от Let«s Encrypt и можете задать закономерный вопрос: зачем это делать веб‑сервером, когда есть утилиты вроде certbot, acme.sh и acmebot? Для ответа нужно хотя бы один раз попробовать модуль ACME и удобство конфигурации станет очевидным.»
Начнём с краткого введения в тему ACME.
Читать далееГрязные данные в CRM — это всегда дубли, ошибки в рассылках и «кривая» аналитика. В статье рассказываю, как я реализовал API для автоматической нормализации телефонов, email и имен на FastAPI, и почему простая проверка регулярками не заменяет систему оценки качества данных (QC).
Попробовать Demo APIПривет, Хабр!
Меня зовут Артём, я фаундер Leadl.ai. Мы строим AI-агента для поиска b2b-клиентов, и одна из его ключевых задач это мониторинг чатов и различных источников.
Звучит просто, пока не сталкиваешься с масштабом.
У нас в пуле 20000+ чатов в 15 источниках. Суммарно около 1000 000 000 сообщений в сутки. Из них реально полезных (запросы на услуги, поиск подрядчиков, вакансии) от силы 3-5%. Остальное: флуд, криптоспам, «доброе утро», мемы и бесконечные стикеры.
Задача: вытащить эти 3-5% качественных сообщений. Первой мыслью было отдать всё на откуп большой LLM типа GPT-4o. Посчитали. Среднее сообщение 50 токенов. 100 000 сообщений 50 токенов/сообщение ($10 / 1M токенов) = $50 в день только на input. Добавьте сюда output и prompt — и счёт легко перевалит за $100-150/день или $3000-4500/месяц. Для стартапа это путь в никуда.
Нам нужен был pipeline, который бы отсеивал мусор на ранних этапах, чтобы до дорогого LLM-скоринга доходило не более 5-10% от всего потока. Вот как мы его построили, через какие грабли прошли и что из этого вышло.
Читать далееКак меняется JavaScript?
JavaScript уникален тем, что работает во всех браузерах. У него нет какого-то одного «владельца», поэтому нельзя внести изолированное изменение и ждать, что оно будет применено везде. Эволюция происходит через TC39 — Технический комитет, отвечающий за ECMAScript.
Предложения должны пройти последовательность этапов развития:
• Этап 0: идея.
• Этап 1: принято пространство задач.
• Этап 2: выбрана архитектура драфта, но работа продолжится.
• Этап 2.7: предложение одобрено в принципе; ожидает тестирования и обратной связи.
• Этап 3: реализация и обратная связь.
• Этап 4: предложение стандартизовано.
В 2018 году, когда я впервые изучал Temporal, он находился на Этапе 1. Комитет TC39 был убеждён, что проблема реальна. Это было радикальное предложение по добавлению в JavaScript новой библиотеки дат и времени. Она должна была:
• Стать заменой Date.
• Добавить новые типы DateTime (вместо единого API).
• Стать неизменяемой.
• Добавить поддержку часовых поясов и календаря.
Но как мы к этому пришли? Почему Date вызывает столько проблем? Чтобы ответить на эти вопросы, нужно вернуться назад.
Читать далееИнтеграционные тесты любят все на словах, пока не доходит до окружения, зависимостей и плясок с подготовкой стенда. В статье разберем более практичный подход: как писать изолированные интеграционные тесты с Testcontainers, не превращая их в хрупкую конструкцию из моков и костылей. На примере PostgreSQL и .NET посмотрим, как собрать тестовую среду, которая ведет себя достаточно близко к реальности, но при этом остается воспроизводимой и управляемой. Тема не новая, а боль до сих пор вполне живая — так что давайте разбираться.
Разобрать подход