В конце 2025 года исследователи из Университета Цинхуа выкатили препринт «Chinese Court Simulation with LLM‑Based Agent System». Они доказали то, о чем многие догадывались давно. Одиночный прогон промта в юридических задачах работает плохо.
Классический RAG‑пайплайн формата «запрос пользователя > поиск по базе > генерация ответа» страдает от склонности к подтверждению. Нейросеть цепляется за первый найденный аргумент и начинает игнорировать факты ради сохранения логики своего ответа. У нее нет внешнего критика.
Китайские коллеги решили эту проблему через состязательную симуляцию (Adversarial Debate). Они стравили прокурора и адвоката на базе нейросетей. Итог оказался показательным. Количество галлюцинаций резко упало, так как выдуманные адвокатом факты тут же опровергались прокурором. В споре моделей родилась истина.
Мы в АйЮрист параллельно строили мультиагентную систему для российских арбитражных судов на базе нашей опенсорсной модели Ken1.0. Когда мы попытались переложить пару академических наработок на B2B, стало понятно, что в суровой реальности архитектура полностью рассыпается.
Ниже приведен разбор того, как устроена первая в России система судебных симуляций, в чем просчитались исследователи из Цинхуа и как мы заставили 10 агентов судиться так, чтобы корпоративные юристы получали реальную пользу.
Читать далееПривет, Хабр! Меня зовут Александр Воробьев. За моими плечами разработка более 100 электронных устройств, пуско-наладка АСУ ТП и множество проектов, где нужно было "прикрутить" датчик к микроконтроллеру, написать веб-интерфейс и заставить это всё работать вместе. Каждый раз — это горы кода, даташитов и времени. В какой-то момент я задался вопросом: а можно ли автоматизировать этот процесс? Чтобы инженер думал над архитектурой, а не над синтаксисом? В этом посте я поделюсь своим путем создания инструмента, который позволяет собирать сложные IoT-системы за минуты с помощью AI-агента, и покажу это на реальных кейсах.
Читать далееГод назад компания Anthropic выпустила Claude Code, заставив других конкурентов догонять.Даже генеральный директор Anthropic Дарио Амодей был удивлен тем, с каким энтузиазмом поначалу отнеслись к следующему прорывному продукту стартапа.
Читать далееСбер в аналитике «Мегатренды 2035» зафиксировал пять структурных сдвигов в российском обществе. Урбанизация, рост прекариата, поляризация доходов, поколение Z и phygital-мир — все пять трендов создают почву для одного и того же явления: шеринг-экономики.
Читать далееЕсли у вас есть бот в Телеграме, то наверняка уже поглядываете в сторону Max — аудитория растёт, игнорировать сложно. Первая мысль: наверняка кто-то уже написал удобный Go-клиент. Чем всё закончилось, вы уже догадались — своим клиентом.
Читать далееНейросети для генерации изображений уже давно перестали быть “игрушкой для вау-эффекта”. Сейчас это рабочий инструмент для контента, дизайна, карточек товаров, баннеров, презентаций и даже быстрых прототипов интерфейсов. Но если открыть поиск по запросам вроде «генерация изображений бесплатно» или «нейросеть для генерации изображений бесплатно», чаще всего попадаются одни и те же сервисы, а реально удобные варианты теряются.
Я собрал подборку из 15 сервисов, где можно делать генерацию картинок онлайн бесплатно — с разным уровнем входа: от “ввел промпт и получил результат” до площадок с моделями, LoRA и тонкой настройкой. Список не про “самые хайповые бренды”, а про инструменты, которые действительно полезны в повседневной работе.
Сразу оговорка: у большинства платформ free-режимы и лимиты периодически меняются (кредиты, очередь, доступные модели), поэтому я ориентировался на актуальные условия на момент подготовки статьи и официальные страницы сервисов.
Читать далееНедавно на рынке произошло мощное обновление всей "большой тройки" LLM. Я решил провести исследование и сравнить самые свежие версии моделей от Anthropic, OpenAI и Google, чтобы понять, кто из них лучше всего справляется с ролью "LLM as Real Judge". Причем только в части оценки шансов в апелляции.
Читать далееНачнём не с технологий, а с причины, по которой эта статья вообще нужна.
В физическом мире USB-порт — дыра в периметре. Воткнул флешку — и у тебя либо данные утекли, либо малварь приехала, либо оба сценария одновременно. Stuxnet, обнаруженный в 2010-м (но активный с ~2007), пробил air gap завода в Натанзе — первоначально через завербованного агента, а дальше распространялся через USB-накопители. FIN7 в 2021-22 годах рассылали по почте подарочные коробки (от имени Amazon и HHS) с «флешками» — на деле это были Arduino ATMEGA32U4, эмулирующие клавиатуру и набивающие PowerShell-команды быстрее любого оператора. Конечная цель — Cobalt Strike, затем ransomware (BlackMatter, REvil). BadUSB, продемонстрированный на Black Hat 2014, показал, что любое USB-устройство может прикинуться клавиатурой и вводить команды — и VID/PID фильтрация тут не спасёт, потому что идентификаторы прошиты в firmware и перешиваются за минуту.
VDI в теории решает часть проблем: данные живут на сервере, а не на эндпоинте. Но USB-редиректор эту изоляцию пробивает — если разрешить проброс mass storage, пользователь утащит файлы на флешку ровно так же, как с физического ПК. А если не разрешить — придут люди со смарт-картами и принтерами, и скажут «нам нужно работать».
Вот тут начинается инженерный компромисс, который не решается одним галочкой в политике.
Читать далееВсем привет! Прошел насыщенный год, и пришло время поделиться тем, что успело произойти с моей мобильной игрой "Лампочка". Изначально я хотел поручить написание этого текста ИИ, но, прочитав его творчество, решил отказаться от этой идеи. В этом материале я расскажу, как мы делали масштабное обновление.
Читать далееЯзык программирования Zator представляет собой интересный и четко очерченный пример доменно-ориентированного языка, разработанного не для универсальных задач программирования, а для решения одной конкретной, но все более значимой проблемы — построения сложных генеративных пайплайнов для создания текста и изображений = Его философия коренится в стремлении минимизировать "шаблонный" код, который традиционно мешает созданию содержания, и предоставить разработчикам, дизайнерам и другим создателям контента высокоуровневые абстракции для работы с передовыми технологиями искусственного интеллекта . В отличие от мощных, но часто громоздких общепurpose языков, таких как Python или JavaScript, Zator делает ставку на простоту, скорость и специализацию, что определяет его место в экосистеме инструментов для ИИ =
Основная идея, лежащая в основе Zator, заключается в том, чтобы стать "языком описания пайплайнов", который работает поверх существующих сервисов искусственного интеллекта, а именно KoboldCpp и Stable Diffusion = Задача создания последовательностей, где результат одного шага (например, сгенерированный текст) используется как вход для следующего (например, промпт для генерации изображения), требует сложного взаимодействия с API. Это обычно включает в себя написание кода для сетевых запросов, управления состоянием, парсинга JSON-ответов и обработки файлов. Zator призван инкапсулировать всю эту сложность внутри нескольких ключевых функций, таких как generate_text() и generate_img(), которые абстрагируют низкоуровневые детали и позволяют пользователю сосредоточиться исключительно на логике своего пайплайна . Таким образом, язык позиционируется как инструмент, снижающий порог входа для людей без глубоких знаний в области системного программирования или веб-разработки, позволяя им быстро экспериментировать и создавать сложные генеративные сценарии .
Читать далееЧто такое свобода? Если мы попробуем дать определение этому понятию, окажется, что их существует великое множество. Словарные, философские, правовые, обыденные. Они есть в книгах, есть в Википедии, есть в нормативных актах, исторических и ныне действующих.
Как и многие поистине важные понятия, свобода вроде бы очевидно понятна каждому, но при этом вряд ли большинство сможет дать четкое определение, что же именно он понимает под этим словом.
Так что же такое свобода, как в этом понятии объединяются право, дух и капитал и как это все связанно с современностью?
Читать далееПредлагаю вам способ шифровать свои сообщения, используя любой мессенжер, в том числе Max. Работать будет на любой ОС, где есть броузер не старше 7 лет.
Читать далееПривет, Хабр!
Если вы когда-нибудь сталкивались с задачей запуска сотен изолированных фоновых процессов на одном сервере (будь то парсеры для клиентов, торговые боты или обработчики данных в SaaS), то вы знаете, как быстро всё усложняется.
Можно, конечно, вручную поднимать Docker-контейнеры и писать костыли для мониторинга. Можно развернуть полноценный Kubernetes, но для одной ноды это часто — оверкилл, требующий отдельного администратора. Можно использовать Celery, но он управляет задачами, а не контейнерами, и изоляция на уровне процессов — это не тоже самое, что изоляция на уровне контейнеров.
Мы столкнулись с этой болью и написали инструмент, который закрывает этот пробел. Встречайте: RedTailFox — легковесный оркестратор на Python, который управляет Docker-контейнерами с вашими воркерами на одном сервере. Он сам решает, когда поднять новый контейнер, сам следит за здоровьем слотов и сам себя чинит.
Читать далееВ задачах стабилизации и высокоточного наведения присутствуют постоянные проблемы — классические алгоритмы (вроде PID-регуляторов) на высоких скоростях либо начинают звенеть из-за шумов дифференциальной составляющей, либо безнадежно отстают от динамики цели из-за фазового лага. С другой стороны, попытки внедрить туда тяжелые нейросети разбиваются о нехватку ресурсов микроконтроллера и неприемлемые задержки вычислений (latency).
Я разработал алгоритм управления, в основе которого лежит легковесное рекуррентное нейро-алгебраическое ядро. Оно работает напрямую с матрицами вращения в топологическом пространстве SO(3), что позволяет избежать множества проблем классической аппроксимации.
Читать далее09:12 — db-replica-02 connection timeout
HTTP 5xx = 0.2%
HAProxy зелёный
p50 = 38-42ms
Replica в другой стойке недоступна
Отказоустойчивость потеряна
Инцидент не объявлен
Краткий экскурс моего опыта разработки и написания реалистичных боевых сцен в художественном романе и как нейросети этому сопротивляются.
Узнать подробнееИИ-контент. Что это для вас?
ИИ сегодня не использует только ленивый. Это просто, удобно, быстро и не дорого (если вообще не бесплатно). ИИ уже может все от текстов и картинок до кода и музыки. Но есть вопрос, о котором никто не думает до первого суда: кому это принадлежит?
Мне, как IT-юристу было любопытно в этом разбираться. Но для авторов и создателей это вопрос не любопытства, а потенциальных исков и штрафов.
На первый взгляд регулирования нет, закона нет, многие думают, что все можно.
Вы тоже?
Читать далееЕсть паттерн, который видит каждый, кто работает с агентами: первые 5–15 минут уходят не на задачу, а на "ориентацию". Где точка входа? Откуда растут зависимости? Почему эта библиотека, а не другая? Кто считает это публичным API? В маленьком проекте раздражает. В большом — превращается в постоянный налог на токены и внимание.
DSP (Data Structure Protocol) "выносит карту проекта наружу" — в простой, версионируемый, языковой граф, который живёт рядом с кодом и доступен агенту как постоянная память.
k-kolomeitsev/data-structure-protocol
Цель в архитектуре сформулирована так:
1) Цель и границы
Цель DSP — хранить минимальный, но достаточный контекст о репозитории/системе артефактов в виде графа «сущности → зависимости/публичный API», чтобы LLM могла:
- быстро находить нужные фрагменты по UID,
- понимать «зачем» сущности существуют и «как» они связаны,
- не требовать загрузки исходников целиком в контекстное окно.
DSP — это долговременная память и индекс проекта для LLM. Агент может в любой момент выполнить поиск (grep) по проекту, найти нужные сущности по описаниям/ключевым словам и от найденного UID раскрутить весь граф связей: входящие зависимости, исходящие импорты, реципиентов через exports. Это заменяет необходимость «помнить» структуру проекта или загружать его целиком — вся карта проекта всегда доступна через .dsp.
Читать далееИногда в человеке возникает странное чувство.
Ты вроде занят. В календаре что-то стоит. Руки что-то делают. Мозг даже устал. Но внутри — неприятное, липкое ощущение: я делаю что-то не то.
Как будто ты идёшь, но не приближаешься. Как будто вместо движения — имитация движения. Как будто каждый следующий час просто откусывает кусок жизни — и не оставляет ничего, кроме “я был занят”.
Я заметил это чувство и сначала попытался отмахнуться: “ну, просто устал”, “надо собраться”, “завтра будет легче”. Но оно не уходило. И тогда я сделал непривычную вещь: начал разбирать не себя, а задачу.
И вдруг стало ясно: проблема не в том, что я ленивый или недостаточно дисциплинированный. Проблема в другом: у меня нет аргументов, почему я должен делать сейчас именно эту задачу.
А если честных аргументов нет — появляются сомнения. И эти сомнения разъедают мотивацию намного сильнее, чем усталость.
Дальше — хуже: я смотрю на список дел и вижу десятки задач. И все они… как будто равнозначны.
Как выбрать?
Читать далееСразу успокоим читателя: AI не вытеснил data-инженера из рабочего процесса. Наоборот, он сделал эту роль еще более значимой. И в этой статье объясняется, что именно это означает для вас и вашей профессии. Не с точки зрения технологий и инструментов, а с точки зрения изменения зоны ответственности.
AI, как и везде, конечно классно справляется с некоторыми задачами, но всю ответственность по-прежнему несет человек. Весь контекст не передашь через промпт, и AI не делает компромиссных решений. Большинство систем не выходят из строя, потому что было сложно написать код. Выходят потому что решения по разработке были приняты поспешно, и без четкого понимания, кто и как этими системами будет пользоваться. И AI еще быстрее за нас принимает решения, но все те же риски «непонимания контекста» остаются.
Читать далее