Habr.com

Syndicate content Хабр
Все публикации подряд на Хабре
Updated: 15 sec ago

Анатомия трансформеров: почему обычный Self-Attention больше не используют

1 hour 29 min ago

Последние годы мы наблюдаем гонку контекстных окон: 32k, 128k, 1 миллион токенов. Но за этой магией скрывается сложная математика, которая прошла долгий путь эволюции. Многие слышали про механизм Attention и загадочные матрицы Query, Key, Value, но далеко не все понимают их физический смысл. Почему мы вообще умножаем ключи на запросы и причем тут «внимание»?

Я предлагаю разобрать работу трансформеров на интуитивно понятном примере «ржавого ключа», чтобы увидеть, как именно слова передают друг другу смысл и формируют контекст.

Читать далее

Планирование расписаний водителей: как математическая модель укрощает хаос перевозок

1 hour 32 min ago

Что есть план, если ему не следуют? Системы планирования работы сотрудников представляют человека в виде последовательности операций: работа, обед, работа, сон. Иногда и того проще - оставляют без обеда. Такая саркастическая интерпретация жизни вызывает улыбку и наводит на грустные размышления. Но в этой статье мы не будем уделять внимание сентиментам, а сосредоточимся на бездушном повествовании об одной из таких систем, а точнее - о задаче планирования графиков работы водителей на круговых маршрутах.

Работа будет полезна специалистам в области логистики, транспортного планирования и оптимизации, а также исследователям в сфере математического моделирования транспортных задач.

Читать далее

Онлайн-курс «Jira: управление потоком задач»

1 hour 35 min ago

Хочу представить вашему вниманию материалы по обучению Jira, которые я бережно собирал на протяжении последних 10 лет на очных или онлайн-тренингах в нескольких учебных центрах.

Сразу оговорюсь, что материал бесплатный, доступен на RuTube, мне важна ваша обратная связь, и конечно будут приятны лайки, комментарии и подписки на канал.

Курс лучше всего подойдёт начинающим пользователям Jira, делающим первые шаги в системе. Хотя для опытных пользователей и даже админов наверняка найдутся интересные темы, и возможность дополнить и структурировать имеющиеся знания.

Читать далее

Децентрализованный ИИ Gonka: Мой опыт запуска ноды для майнинга на арендованном сервере

1 hour 44 min ago

Вступление

На днях я наткнулся на проект братьев Либерманов - децентрализованную инфраструктуру ИИ под названием Gonka. Признаюсь, их идея меня зацепила. ИИ сегодня - это новое электричество, новый интернет, даже новая гравитация. Он проникает во все сферы жизни: где-то плавно и незаметно, где-то резко и стремительно, но всё более неотвратимо.

Если кратко, Gonka - это децентрализованная AI-инфраструктура, предлагающая альтернативу дорогим облачным вычислениям для обучения и инференса моделей. Вместо расчёта хэшей (как в Bitcoin) система использует вычислительные мощности GPU для решения реальных задач ИИ. Хосты получают вознаграждение в токенах Gonka, а разработчики - доступ к более дешёвым ресурсам для развертывания приложений.

Читать далее

Архитектура как код

1 hour 46 min ago

Всем привет! Меня зовут Сидоров Антон, я руководитель отдела технической архитектуры в департаменте сопровождения информационных технологий ПСБ. Моя команда занимается архитектурой инфраструктурных систем, и сегодня я хочу рассказать вам про наш первый опыт использования подхода «Архитектура как код»

Читать далее

Предиктивная аналитика в финтехе: модели, конвейер данных и риски внедрения

2 hours 22 min ago

Финансовые системы каждый день генерируют потоки данных: транзакции, котировки, события в мобильных приложениях, отчёты партнёров. Данные легко превратить в витрины и отчёты. Сложнее — превратить их в прогноз, который помогает принять решение в моменте.

Предиктивная аналитика отвечает на вопрос «что, скорее всего, произойдёт дальше». В финтехе это обычно сводится к вероятности события или прогнозу числа: риск дефолта, вероятность мошенничества, ожидаемый спрос на продукт. Дальше модель уже превращают в действие: лимит, скоринговый порог, приоритет проверки.

В статье расскажем, какие типы моделей чаще используют в финтехе, где они применяются, как обычно устроен конвейер данных и моделей, и какие ограничения чаще всего ломают качество в эксплуатации.

Читать далее

Орбитальные дата-центры: патентный анализ

2 hours 26 min ago

Хабр уже писал, что идея «ЦОД в космосе» на низкой околоземной орбите (LEO, 400 км) вышла за рамки научной фантастики. 

Компания Axiom Space в сентябре 2025 г. заявила о создании первого орбитального дата-центра AxODC (от Axiom orbital data center), который разместился на Международной космической станции МКС. Этот ЦОД будет обслуживать не только станцию, но также любые спутники с оптическими терминалами на борту. Использованы 64-разрядные процессоры Microchip PIC64-HPSC и накопители SSD Phison Pascari объёмом 128,88 Тбайт. Терминал способен обеспечить скорость связи с ЦОД на борту МКС до 2,5 Гбит/с. В будущем скорость обмена будет повышена до 100 Гбит/с. 

Мы решили разобраться, что с патентами на орбитальные ЦОДы. 

Читать далее

[Перевод] Говорят ли LLM на языке BPMN? Оценка их возможностей моделирования процессов на основе качественных метрик

2 hours 29 min ago

Большие языковые модели (LLM) становятся мощными инструментами для автоматизации моделирования бизнес-процессов, обещая упростить перевод текстовых описаний процессов в диаграммы Business Process Model and Notation (BPMN). Однако степень, в которой эти системы ИИ способны создавать высококачественные BPMN-модели, пока не подверглась тщательной оценке.

Данная статья представляет оценку пяти инструментов генерации BPMN на базе LLM, автоматически преобразующих текстовые описания процессов в BPMN-модели. Для оценки качества этих моделей ИИ мы вводим новую структурированную систему, которая присваивает баллы каждой BPMN-диаграмме по трем ключевым измерениям качества моделей процессов: ясность/читаемость, корректность и полнота, охватывающим как точность, так и понятность диаграммы.

Используя эту систему, мы провели эксперименты, в которых каждому инструменту поручалось моделировать один и тот же набор текстовых сценариев процессов, а полученные диаграммы систематически оценивались по критериям. Этот подход обеспечивает последовательную и воспроизводимую процедуру оценки и предлагает новую линзу для сравнения возможностей моделирования на базе LLM.

Наши выводы показывают, что хотя существующие инструменты на базе LLM способны создавать BPMN-диаграммы, отражающие основные элементы описания процесса, они часто демонстрируют ошибки — пропущенные шаги, непоследовательную логику или нарушения правил моделирования, что подчёркивает ограничения в достижении полностью корректных и полных моделей. Чёткость и читаемость генерируемых диаграмм также различаются, указывая на то, что эти модели ИИ всё ещё находятся на стадии созревания в генерации легко интерпретируемых потоков процессов.

Читать далее

«Эллес» vs Samba: как мы начинали создавать отечественную службу каталогов

2 hours 38 min ago

Привет, Хабр. В этой статье мы разберём ключевые различия между отечественной службой каталогов «Эллес» и её основой — Samba, и расскажем, почему для создания российского аналога Active Directory выбрали именно этот проект с открытым кодом.

Читать далее

ИИ для проверки договоров, AI-поиск компаний и организаций — и ещё 8 российских стартапов

2 hours 54 min ago

10 новых российских продуктов для создания и продажи курсов, отслеживания цен на товары, отправки HTML-писем из стандартных почтовых клиентов, автоматизации маркировки рекламы и многого другого. Битва за «Продукт недели» началась!

Product Radar — здесь каждую неделю публикуются лучшие онлайн-сервисы и железки от русскоязычных команд.

Читать далее

Обзор 5 линеек процессоров для встраиваемого применения

3 hours 9 min ago

В начале января несколько полупроводниковых компаний, среди которых Intel, AMD, NXP, Qualcomm, Renesas анонсировали свои новые линейки процессоров для встраиваемого применения и, как сейчас принято, ориентированных на решение задач связанных с ИИ.

Читать далее

PostgreSQL и 1С: как построить систему поиска «тихих убийц» производительности

3 hours 14 min ago

Стандартный мониторинг часто пропускает «тихих убийц» — запросы, которые по отдельности кажутся нормальными, но в сумме создают аномальную нагрузку на СУБД. В итоге система живет в хрупкой идиллии до первого аврала.

В статье — описание универсального способа контроля качества кода и нагрузки на базу без выделенного DBA. Пошагово разберем поиск неоптимальных запросов с помощью pgBadger на живом кейсе.

Читать далее

Как сайты превращают браузер в рекламный бот: разбор вредоносного push-spam SDK

3 hours 23 min ago

Push-уведомления сами по себе — полезный инструмент для легальной коммуникации с пользователями: новости, события, обновления сервисов.

Однако существуют вредоносные SDK, которые используют Push API для скрытого спама, трекинга и монетизации через сторонние рекламные серверы. Они используют легальные браузерные API, но наносят серьёзный вред пользователю и репутации сайтов.

В этой статье разберём реальный вредоносный скрипт https://kidecyg.com/13850.js, покажем как он работает, зачем каждый элемент кода нужен и как его выявить.

Читать далее

CPython — Сборка мусора изнутри, ч.3

3 hours 29 min ago

В прошлых частях мы поговорили о том, как происходит регистрация объектов в сборщике мусора, о том как происходит планирование и вызов сборки мусора, что такое молодое поколение и как устроена для него сборка мусора. В этой части пришло время поговорить об инкрементальной сборке мусора — главному нововведению версии 3.14 в части сборки мусора. Поговорим, как она устроена, какие даёт преимущества и какие имеет недостатки, а также затронем полную сборку мусора.

Если вам интересно, давайте попробуем разобраться.

Читать далее

Что читать и смотреть в 2026. Эпичная подборка для разрабов, лидов, CTO и архитекторов

4 hours 29 min ago

По просьбе подписчика моего ТГ-канала публикую список источников для самоподготовки. Легендарные вещи, полностью изменившие мои взгляды на индустрию.

Читать далее

RLM: Почему ваш LLM-агент забывает цель и как это исправить

7 hours 17 min ago

Ваш LLM-агент забывает цель через 10 шагов? Контекст "гниёт" на длинных документах? Модель галлюцинирует? Разбираем 10 реальных проблем LLM-приложений и паттерн RLM, который их обходит — без замены модели. С примерами кода и FAQ для новичков.

Читать далее

Plain text serialization

7 hours 35 min ago

Я люблю простые костыли.

Когда требуется сериализовать некоторые поля в какой-то текстовый формат,
бывает удобно использовать промежуточное представление данных вида:

// Name/Value item
public class NVItem {
public string? Name;
public object? Value;
public IEnumerable? SubItems;

public NVItem(string? name, object? value) {
Name = name;
if (value==null) return;
SubItems = value as IEnumerable;
if (SubItems != null) return;

// Упс!
Value = value as string;
if (Value != null) return;

var num = value as IEnumerable;
if (num==null) {
Value = value;
} else {
SubItems = num.Cast<object>().Select(t => new NVItem(null, t));
}
}
}

Читать далее

[Перевод] Всего одна строка кода, из-за которой 24-ядерный сервер стал работать медленнее ноутбука

10 hours 55 min ago

Допустим, вы написали код для решения задачи, которая хорошо распараллеливается. Каждый поток занимается своим участком работы и не зависит от других, поэтому потоки почти не должны координироваться друг с другом, за исключением самого последнего этапа, когда требуется объединить результаты. Естественно, в данном случае логично предположить, что чем больше ядер задействуется для такого кода, тем быстрее он выполнится. Вы ставите бенчмарки и сначала прогоняете этот код на ноутбуке. Действительно, оказывается, что он практически идеально масштабируется на всех четырёх доступных ядрах. Затем вы прогоняете его на большой и пафосной многопроцессорной машине, рассчитывая, что производительность будет ещё выше — но убеждаетесь, что на практике этот код работает даже медленнее, чем на ноутбуке, сколько бы ядер под него не выделить. Да, именно с таким случаем мне однажды довелось столкнуться.

Читать далее

Клиенты, отток и приток: где бизнес чаще всего ошибается?

11 hours 31 min ago

Начнем данную статью с казалось бы простого вопроса: "Кто такие клиенты и зачем их считать?". Ответ на данный вопрос не такой простой и вообще философский! Каждая компания и человек в отдельности ответят на него по-своему.

В телеком компании вам скажут: "Клиент = абонент. Мы считаем их прирост, а также дни, в течение которых они платят нам абонентскую плату.". В небольшой парикмахерской вам, возможно ответят так: "Ну вот кто пришел стричься, тот и клиент. Считаем количество тех, кто постригся за отрезок времени.". Подсчет клиентов может даже пригодиться для оценки компании третьими лицами, здесь также используются свои методологии. И так далее... Думаю, мораль ясна, каждый определяет для себя сам, кто является клиентом и как их считать.

Но может быть существует более универсальный способ подсчета клиентов? В следующих разделах я постараюсь предоставить такой способ, пусть меня рассудят в комментариях.

Читать далее

Когда агент вынужден быть разумным: модель автономной среды

11 hours 33 min ago

Существует ли такая задача или класс задач, в которых машина вынуждена демонстрировать разумное поведение, а не просто оптимизировать заранее заданную цель?

Читать далее

Who's online

There are currently 0 users and 1 guest online.