Habr.com

Syndicate content Хабр
Все публикации подряд на Хабре
Updated: 1 hour 58 min ago

Компрессор для данных или как я написал свой первый custom transformer

2 hours 11 min ago

Эта статья будет полезна DS специалистам, и тем, кто хоть когда-нибудь сталкивался с такой проблемой, как выбросы в данных или OOD (out of distribution), и ищет пути решения проблем, возникающих из-за них.

Читать далее

Спасаем Бингус, и как я поправил ИИ помощника. Мануал для новичков

2 hours 18 min ago

Ещё одна очередная задачка! На этот раз нам предстоит спасти нашего друга! Bingus'а! Давайте же спасём его!

А ещё посмотрим на то как ИИ к сожалению, не смогла помочь нам.

Спасти Bingus

Навангуют на миллиарды: история Polymarket

2 hours 47 min ago

Polymarket — это платформа для предсказаний, основанная на блокчейне. Пользователи могут делать прогнозы (используя криптовалюту) на результаты спортивных турниров, а также на исход экономических, научных, политических и светских событий. Рассказываем в нашей статье, как Polymarket стала феноменом на рынке предсказаний, а также о скандалах, связанных с платформой.

Читать далее

Multi-Agent Systems в LegalTech: как симуляция судебного процесса повышает точность предсказаний (разбор SimCourt)

3 hours 9 min ago

В современном LegalTech порог входа стремительно растет: просто "обернуть" API OpenAI в красивый интерфейс уже недостаточно - рынок требует кастомных архитектурных решений для повышения метрик точности. В поиске новых механик для "неШемяки!" (мой проект по предиктивной аналитике судебных процессов) все чаще погружаешься в китайские и индийские исследования. Как кажется, они потихоньку становятся лидерами AI LegalTech - судя по публикациям, именно в Азии сейчас наблюдается настоящий бум прикладных экспериментов с agentic workflows в юриспруденции.

И вот, новогодний подарок - препринт "Chinese Court Simulation with LLM-Based Agent System" исследователей из Университета Цинхуа (декабрь 2025). Китайские коллеги пошли дальше простых промптов и построили полноценную мультиагентную систему (MAS), где модели судят моделей. Ниже - разбор архитектуры SimCourt, результаты сравнения с живыми юристами и немного о том, как это проецируется на реальный продакшен.

Авторы исследования сфокусировались на фундаментальной проблеме текущих Legal AI решений - ограничениях single-shot inference. Классический пайплайн работает линейно: user input (фабула) -> rag (релевантная практика) -> llm -> verdict. В этой цепочке модель, по сути, играет в шахматы сама с собой. У неё нет внешнего критика или оппонента, который мог бы подсветить логическую ошибку или слабую позицию. Из-за этого даже топовые модели часто скатываются в confirmation bias: зацепившись за первый найденный аргумент "за", нейросеть начинает игнорировать или галлюцинировать факты, противоречащие её гипотезе, лишь бы сохранить когерентность ответа. Чтобы сломать этот паттерн, разработчики SimCourt заменили одиночный прогон на role-playing simulation - многоступенчатую агентную симуляцию, где истина рождается не в "голове" одной модели, а в конфликте нескольких

Читать далее

Cryanide как альтернативная ветвь развития web-технологий

3 hours 12 min ago

Кратко о том, почему я не использую фреймворки, зачем пишу всё с нуля и к чему это привело.

Я написал полноценный SDK для web-приложений как концепт альтернативной ветви развития, если бы web-индустрия пошла по пути игровых движков.

Почему и зачем?

Туда и обратно <—> как компании мигрировали в публичное облако, а теперь возвращаются к частному

3 hours 14 min ago

Решили поговорить о ключевых тенденциях облачного рынка и о феномене «большой миграции» — почему все больше компаний уходит из публичных облаков в частные. Ветер переменился в том числе под влиянием систем ИИ, поскольку компании предпочитают проводить тонкую настройку кастомных моделей и контролировать данные для обучения в более изолированной среде.

Читать далее

Особенности совещаний на проектах внедрения ERP-систем

3 hours 50 min ago

В этой статье — неочевидный взгляд на эффективность совещаний в ERP-проектах: не количество совещаний или участников, а результат.

Читать далее

[Перевод] Частная компания раскрыла планы по созданию большого космического телескопа

3 hours 55 min ago

Группа филантропов-миллиардеров финансирует разработку ряда новых обсерваторий, в том числе космического телескопа, превосходящего по размерам телескоп «Хаббл», который, по словам его спонсоров, можно построить за гораздо меньшую сумму и в гораздо более короткие сроки.

Компания Schmidt Sciences, основанная бывшим исполнительным директором Google Эриком Шмидтом и его женой Венди Шмидт, 7 января объявила о создании системы обсерваторий Эрика и Венди Шмидт, состоящей из четырёх обсерваторий, которые планируется построить в течение следующих нескольких лет.

Читать далее

Cloud-9 — реликтовая беззвёздная протогалактика

4 hours 4 min ago

Около года назад я публиковал в этом блоге перевод статьи «Что, если мы никогда не найдём тёмную материю?». Авторы оригинала привели подробную инфографику, демонстрирующую, из каких гипотетических частиц может состоять эта тёмная материя, вернее, неучтённая масса. Как ни странно, авторы не упоминают RELHIC – беззвёздные газовые облака, размеры которых ограничены реионизацией. На момент подготовки этой статьи феномен охарактеризован в Википедии как «теоретическая концепция», однако, вполне возможно, первый реально существующий объект такого рода был описан в самом начале 2026 года. Облако RELHIC по форме и размеру напоминает галактику, но не содержит звёзд, а, как можно предположить, состоит преимущественно из тёмной материи.

Читать далее

Стресс-тест функций активации: GELU vs Tanh

4 hours 10 min ago

В современных нейросетях, включая LLM на базе Transformer, стандартом стали неограниченные функции активации — ReLU и GELU. Их основное преимущество, хорошая проходимость градиентов и быстрое обучение глубоких моделей.

Однако на практике наблюдается проблема: при появлении доминирующих паттернов или высокочастотного шума во  входном контексте (длинные диалоги, шумные данные, повторяющиеся или доминирующие токены) модели становятся нестабильными и склонными к деградации генерации и галлюцинациям.

В этой статье я попытался выяснить, связан ли принципиально выбор функции активации с галлюцинациями LLM.

Читать далее

За пределами LLM: детерминированный движок рассуждения на конечном алфавите

4 hours 12 min ago

В статье я показываю альтернативу LLM в роли решателя внутри продукта: детерминированное ядро, работающее на конечном алфавите состояний с таблично заданной бинарной операцией — lookup/transition table.
Вместо вероятностных ответов — воспроизводимые вычисления с замыканием (фикс-точка или цикл), учётом симметрий (автоморфизмов) для факторизации перебора и со строгим контуром проверки: спецификации, валидаторы, регрессия и публичный отчёт в стабильном JSON-формате.
Систему можно запустить локально одной командой — или прогнать прямо в ChatGPT, если включён режим выполнения кода: вы получите PASS/FAIL и полный комплект артефактов прогона.

Читать далее

Оптимизация рендера 2D-персонажей в MonoGame: Прагматичный подход слоёв и инстансинга

4 hours 12 min ago

Теги: #monogame #gamedev #оптимизация #csharp #графика #индиразработка

Введение: Проблема падающих FPS и желание красоты

Каждый разработчик 2D-игр, мечтающий о живом, населённом мире, рано или поздно упирается в суровую реальность: рендеринг множества уникальных анимированных персонажей — это дорого. Хочется дать игроку кастомизацию, смену снаряжения, разнообразие врагов, но классический подход «нарисовать каждый спрайт отдельно» ведёт к сотням draw calls и падению производительности.

В своей инди-игре (симуляторе жизни в мире фэнтези-жуков) я столкнулся с этой проблемой в полный рост. Мне нужны были десятки NPC на экране, каждый — с возможной сменой брони и оружия. Решением стала гибридная система рендеринга, основанная на разделении персонажей по уровням детализации и использовании инстансинга. В статье я разберу её архитектуру, код и полученные выгоды.

Часть 1: Анализ проблемы — почему «в лоб» не работает

Допустим, у персонажа 10 слоёв: тело, голова, ноги, броня, шлем, оружие в каждой руке и т.д. Если рендерить каждый слой отдельным вызовом SpriteBatch.Draw(), для 50 NPC мы получим 50 × 10 = 500 draw calls. При целевом значении в 60 FPS у нас есть всего ~16.6 мс на кадр. Если один draw call занимает ~0.1 мс, только на отрисовку персонажей уйдёт 50 мс — это в три раза больше бюджета!

Ключевой инсайт: Не всем персонажам нужна одинаковая детализация. Фоновому горожанину или стае врагов не требуется динамическая смена снаряжения. А главному герою — требуется.

Часть 2: Гибридная архитектура — 3 уровня детализации

Читать далее

На стыке AI и науки: Летняя школа Veai для студентов

4 hours 20 min ago

День студента — отличный повод поговорить не только о сессиях и вечеринках, но и о том, зачем вообще учиться.

Новые идеи и технологии, нестандартные решения появляются там, где есть пространство для эксперимента, глубокого исследования и диалога между академической средой и индустрией.

Образовательные проекты совместно с ведущими ВУЗами Росиии, ИТМО и СПбГУ – важная часть нашей работы. Летняя школа Veai – это не обычная стажировка, а возможность для студентов попробовать себя в реальных задачах, увидеть практическое применение своих знаний.

В 2025 году Летняя школа Veai прошла уже в третий раз. В течение полутора месяцев 8 талантливых ребят работали над проектами на стыке компьютерных наук и IT. Помогали и обучали их кураторы из Veai, действующие преподавателями СПбГУ (матмех и факультет математики и компьютерных наук).

Мы предложили ребятам такие темы:

Проекты и отзывы

[Перевод] Второй отец MP3

4 hours 26 min ago

Работая в Bell Labs, Джеймс Д. Джонстон 26 лет посвятил созданию технологии, которую мы сегодня знаем как MP3. Затем его имя растворилось в истории...

Вступление от «Rogues’ Gallery»

Всякий раз, когда вы прослушиваете чей-нибудь альбом, подкаст или скачиваете трек, то используете технологию, которой не существовало бы без метода перцептуального кодирования аудиосигнала. В основе этого метода лежит научное понимание диапазона воспринимаемых человеческим ухом частот и на основе этого сжатие аудио таким образом, чтобы оставить в нём только самое важное.

И наше шоу (имеется в виду подкаст «The Rogues’ Gallery», — прим. пер.), как и многие другие, существует, благодаря той самой технологии. Ничто из этого не оказалось бы возможным, если бы не инженеры, которые научились втискивать час музыки в файл, достаточно небольшой для скачивания через коммутируемое соединение.

В прогрессив-роке мы чествуем виртуозов, музыкантов, которые раздвигают известные границы и создают что-то новое. Но в сфере технологий тоже есть виртуозы. Люди, которые десятилетиями оттачивают своё мастерство, чья работа изменила мир, и кто так и не получил заслуженного признания.

Одним из таких людей является Джеймс Д. Джонстон. В IEEE его зовут «отцом перцептуального аудиокодирования». Этот человек зарегистрировал более, чем 100 патентов. Кен Томпсон, который разработал Unix, лично переписывал код для созданного им кодека, сказав, что тот значительно превосходит MP3. Федеральный апелляционный суд США подтвердил, что он изобрёл формат MP3 параллельно с Карлхайнцем Бранденбургом. Но всё же в рассказах об истории развития цифрового аудио его имя всплывает крайне редко.

Джеймс является такой же рок-звездой, каких мы приглашаем на наше шоу. Просто он играет на другом инструменте.

И это история о нём.

Читать далее

Второй уровень автономности ИИ: агент сам управляет облаком и администрирует ВМ по SSH

4 hours 29 min ago

Я решил проверить следующий уровень — может ли ИИ не советовать, а выполнять действия сам.

В этом эксперименте ИИ:

управлял Yandex Cloud через yc

сам создавал ВМ и Managed PostgreSQL

сам подключался по SSH к ВМ

администрировал сервер

поднимал WordPress в Docker

и подключал его к базе, созданной в облаке

Без Terraform.
Без Ansible.
Без ручного выполнения команд человеком.

Это не туториал и не реклама.
Это практическое исследование второго уровня автономности ИИ, где агент реально работает в инфраструктуре, а человек остаётся в контуре управления.

Читать далее

[Перевод] OpenCode + Docker Model Runner для локальной разработки с ИИ

4 hours 38 min ago

Команда AI for Devs подготовила перевод статьи о том, как использовать OpenCode вместе с Docker Model Runner для локальной разработки с LLM. В центре внимания — контроль над кодом, данными и затратами: модели запускаются локально, контекст не уходит во внешние сервисы, а ИИ-ассистент становится частью вашей инфраструктуры, а не сторонним SaaS. Практический разбор для тех, кто хочет использовать ИИ в разработке без компромиссов по безопасности и стоимости.

Читать далее

Make DLL Hijacking Great Again

4 hours 55 min ago

DLL hijacking - техника, которая может дать множество преимуществ: повыситься до NT AUTHORITY/SYSTEM, получить исполнение от лица привилегированного пользователя, действовать от лица легитимного приложения и т. д.

Естественно, перед тем как ее осуществить, нужно найти подходящее приложение и библиотеку, которую можно подменить.

Вручную это может быть долго и рутинно. Если цель - отыскать библиотеки, загружаемые во время выполнения, задача превращается в неочевидный и длительный реверс-инжиниринг.

Цель статьи - описать подход, который позволит реализовать средство автоматической диагностики приложения и подмены библиотек.

Читать далее

Мобильная разработка за неделю #616 (19 — 25 января)

4 hours 57 min ago

В этом выпуске разработка приложений с помощью ИИ и состояние мобильного рынка, MVVM и плагины для Android Studio, миграция на Android Gradle Plugin 9.0, сокращение потребления памяти, бесплатный Skip, FunctionGemma от Google и многое другое. Заходите!

Читать далее

Ред флаги, но не в тиндере: что важно понять data-специалисту ещё до офера

5 hours 5 min ago

Пятничный вечер, бар, шумные разговоры. Мы - компания из нескольких ML-инженеров, DE и DA из Сбера, Магнита, Озона и Альфа-Банка собрались не ради обсуждения задачек в JIRA. Разговор зашел о наболевшем: как найти своих людей и команду мечты? Обсудили зарплату и плюшки, удалёнку и офис, стартапы и зрелые продукты, переработки, карьерный рост и рабочую культуру. В статье - цитаты из обсуждения и обобщённые выводы. А в конце - список вопросов, которые стоит задать на собеседовании, чтобы не ошибиться с выбором и найти тех людей, с кем не страшно будет выкатить релиз в пятницу вечером.

Читать далее

Скрипты и алиасы для вашего линукса

5 hours 22 min ago

Каждый, кто проводит в терминале больше пяти минут, сталкивается с одним и тем же: одни и те же длинные команды приходится набирать снова и снова, а рутинные действия отнимают время и внимание. Сначала терпишь, потом — начинаешь оптимизировать.

Простейший алиас в .bashrc или .zshrc кажется небольшим открытием. Первый рабочий скрипт, сохранённый в ~/.local/bin, ощущается как прорыв. Это не просто про лень — это про эффективность, про оптимизацию работы.

Со временем такая «мелкая оптимизация» собирается в целый личный фреймворк или набор утилит для командной строки. Это уже не пара заплаток, а твоя собственная среда, отточенная под конкретные задачи. В этой статье я хочу показать свою коллекцию таких скриптов и алиасов — не как идеальный стандарт, а как пример живого подхода. Возможно, какие-то решения окажутся полезными и вам, а главное — побудят создать что-то своё, ещё более удобное.

Читать далее

Who's online

There are currently 0 users and 0 guests online.