Habr.com

Syndicate content Хабр
Все публикации подряд на Хабре
Updated: 32 min 49 sec ago

Предиктивная аналитика в финтехе: модели, конвейер данных и риски внедрения

54 min 43 sec ago

Финансовые системы каждый день генерируют потоки данных: транзакции, котировки, события в мобильных приложениях, отчёты партнёров. Данные легко превратить в витрины и отчёты. Сложнее — превратить их в прогноз, который помогает принять решение в моменте.

Предиктивная аналитика отвечает на вопрос «что, скорее всего, произойдёт дальше». В финтехе это обычно сводится к вероятности события или прогнозу числа: риск дефолта, вероятность мошенничества, ожидаемый спрос на продукт. Дальше модель уже превращают в действие: лимит, скоринговый порог, приоритет проверки.

В статье расскажем, какие типы моделей чаще используют в финтехе, где они применяются, как обычно устроен конвейер данных и моделей, и какие ограничения чаще всего ломают качество в эксплуатации.

Читать далее

Орбитальные дата-центры: патентный анализ

58 min 44 sec ago

Хабр уже писал, что идея «ЦОД в космосе» на низкой околоземной орбите (LEO, 400 км) вышла за рамки научной фантастики. 

Компания Axiom Space в сентябре 2025 г. заявила о создании первого орбитального дата-центра AxODC (от Axiom orbital data center), который разместился на Международной космической станции МКС. Этот ЦОД будет обслуживать не только станцию, но также любые спутники с оптическими терминалами на борту. Использованы 64-разрядные процессоры Microchip PIC64-HPSC и накопители SSD Phison Pascari объёмом 128,88 Тбайт. Терминал способен обеспечить скорость связи с ЦОД на борту МКС до 2,5 Гбит/с. В будущем скорость обмена будет повышена до 100 Гбит/с. 

Мы решили разобраться, что с патентами на орбитальные ЦОДы. 

Читать далее

[Перевод] Говорят ли LLM на языке BPMN? Оценка их возможностей моделирования процессов на основе качественных метрик

1 hour 1 min ago

Большие языковые модели (LLM) становятся мощными инструментами для автоматизации моделирования бизнес-процессов, обещая упростить перевод текстовых описаний процессов в диаграммы Business Process Model and Notation (BPMN). Однако степень, в которой эти системы ИИ способны создавать высококачественные BPMN-модели, пока не подверглась тщательной оценке.

Данная статья представляет оценку пяти инструментов генерации BPMN на базе LLM, автоматически преобразующих текстовые описания процессов в BPMN-модели. Для оценки качества этих моделей ИИ мы вводим новую структурированную систему, которая присваивает баллы каждой BPMN-диаграмме по трем ключевым измерениям качества моделей процессов: ясность/читаемость, корректность и полнота, охватывающим как точность, так и понятность диаграммы.

Используя эту систему, мы провели эксперименты, в которых каждому инструменту поручалось моделировать один и тот же набор текстовых сценариев процессов, а полученные диаграммы систематически оценивались по критериям. Этот подход обеспечивает последовательную и воспроизводимую процедуру оценки и предлагает новую линзу для сравнения возможностей моделирования на базе LLM.

Наши выводы показывают, что хотя существующие инструменты на базе LLM способны создавать BPMN-диаграммы, отражающие основные элементы описания процесса, они часто демонстрируют ошибки — пропущенные шаги, непоследовательную логику или нарушения правил моделирования, что подчёркивает ограничения в достижении полностью корректных и полных моделей. Чёткость и читаемость генерируемых диаграмм также различаются, указывая на то, что эти модели ИИ всё ещё находятся на стадии созревания в генерации легко интерпретируемых потоков процессов.

Читать далее

«Эллес» vs Samba: как мы начинали создавать отечественную службу каталогов

1 hour 10 min ago

Привет, Хабр. В этой статье мы разберём ключевые различия между отечественной службой каталогов «Эллес» и её основой — Samba, и расскажем, почему для создания российского аналога Active Directory выбрали именно этот проект с открытым кодом.

Читать далее

ИИ для проверки договоров, AI-поиск компаний и организаций — и ещё 8 российских стартапов

1 hour 26 min ago

10 новых российских продуктов для создания и продажи курсов, отслеживания цен на товары, отправки HTML-писем из стандартных почтовых клиентов, автоматизации маркировки рекламы и многого другого. Битва за «Продукт недели» началась!

Product Radar — здесь каждую неделю публикуются лучшие онлайн-сервисы и железки от русскоязычных команд.

Читать далее

Обзор 5 линеек процессоров для встраиваемого применения

1 hour 42 min ago

В начале января несколько полупроводниковых компаний, среди которых Intel, AMD, NXP, Qualcomm, Renesas анонсировали свои новые линейки процессоров для встраиваемого применения и, как сейчас принято, ориентированных на решение задач связанных с ИИ.

Читать далее

PostgreSQL и 1С: как построить систему поиска «тихих убийц» производительности

1 hour 47 min ago

Стандартный мониторинг часто пропускает «тихих убийц» — запросы, которые по отдельности кажутся нормальными, но в сумме создают аномальную нагрузку на СУБД. В итоге система живет в хрупкой идиллии до первого аврала.

В статье — описание универсального способа контроля качества кода и нагрузки на базу без выделенного DBA. Пошагово разберем поиск неоптимальных запросов с помощью pgBadger на живом кейсе.

Читать далее

Как сайты превращают браузер в рекламный бот: разбор вредоносного push-spam SDK

1 hour 56 min ago

Push-уведомления сами по себе — полезный инструмент для легальной коммуникации с пользователями: новости, события, обновления сервисов.

Однако существуют вредоносные SDK, которые используют Push API для скрытого спама, трекинга и монетизации через сторонние рекламные серверы. Они используют легальные браузерные API, но наносят серьёзный вред пользователю и репутации сайтов.

В этой статье разберём реальный вредоносный скрипт https://kidecyg.com/13850.js, покажем как он работает, зачем каждый элемент кода нужен и как его выявить.

Читать далее

CPython — Сборка мусора изнутри, ч.3

2 hours 2 min ago

В прошлых частях мы поговорили о том, как происходит регистрация объектов в сборщике мусора, о том как происходит планирование и вызов сборки мусора, что такое молодое поколение и как устроена для него сборка мусора. В этой части пришло время поговорить об инкрементальной сборке мусора - главному нововведению версии 3.14 в части сборки мусора. Поговорим, как она устроена, какие даёт преимущества и какие имеет недостатки, а также затронем полную сборку мусора.

Если вам интересно, давайте попробуем разобраться.

Читать далее

Что читать и смотреть в 2026. Эпичная подборка для разрабов, лидов, CTO и архитекторов

3 hours 2 min ago

По просьбе подписчика моего ТГ-канала публикую список источников для самоподготовки. Легендарные вещи, полностью изменившие мои взгляды на индустрию.

Читать далее

RLM: Почему ваш LLM-агент забывает цель и как это исправить

5 hours 50 min ago

Ваш LLM-агент забывает цель через 10 шагов? Контекст "гниёт" на длинных документах? Модель галлюцинирует? Разбираем 10 реальных проблем LLM-приложений и паттерн RLM, который их обходит — без замены модели. С примерами кода и FAQ для новичков.

Читать далее

Plain text serialization

6 hours 7 min ago

Я люблю простые костыли.

Когда требуется сериализовать некоторые поля в какой-то текстовый формат,
бывает удобно использовать промежуточное представление данных вида:

// Name/Value item
public class NVItem {
public string? Name;
public object? Value;
public IEnumerable? SubItems;

public NVItem(string? name, object? value) {
Name = name;
if (value==null) return;
SubItems = value as IEnumerable;
if (SubItems != null) return;

// Упс!
Value = value as string;
if (Value != null) return;

var num = value as IEnumerable;
if (num==null) {
Value = value;
} else {
SubItems = num.Cast<object>().Select(t => new NVItem(null, t));
}
}
}

Читать далее

[Перевод] Всего одна строка кода, из-за которой 24-ядерный сервер стал работать медленнее ноутбука

9 hours 27 min ago

Допустим, вы написали код для решения задачи, которая хорошо распараллеливается. Каждый поток занимается своим участком работы и не зависит от других, поэтому потоки почти не должны координироваться друг с другом, за исключением самого последнего этапа, когда требуется объединить результаты. Естественно, в данном случае логично предположить, что чем больше ядер задействуется для такого кода, тем быстрее он выполнится. Вы ставите бенчмарки и сначала прогоняете этот код на ноутбуке. Действительно, оказывается, что он практически идеально масштабируется на всех четырёх доступных ядрах. Затем вы прогоняете его на большой и пафосной многопроцессорной машине, рассчитывая, что производительность будет ещё выше — но убеждаетесь, что на практике этот код работает даже медленнее, чем на ноутбуке, сколько бы ядер под него не выделить. Да, именно с таким случаем мне однажды довелось столкнуться.

Читать далее

Клиенты, отток и приток: где бизнес чаще всего ошибается?

10 hours 3 min ago

Начнем данную статью с казалось бы простого вопроса: "Кто такие клиенты и зачем их считать?". Ответ на данный вопрос не такой простой и вообще философский! Каждая компания и человек в отдельности ответят на него по-своему.

В телеком компании вам скажут: "Клиент = абонент. Мы считаем их прирост, а также дни, в течение которых они платят нам абонентскую плату.". В небольшой парикмахерской вам, возможно ответят так: "Ну вот кто пришел стричься, тот и клиент. Считаем количество тех, кто постригся за отрезок времени.". Подсчет клиентов может даже пригодиться для оценки компании третьими лицами, здесь также используются свои методологии. И так далее... Думаю, мораль ясна, каждый определяет для себя сам, кто является клиентом и как их считать.

Но может быть существует более универсальный способ подсчета клиентов? В следующих разделах я постараюсь предоставить такой способ, пусть меня рассудят в комментариях.

Читать далее

Когда агент вынужден быть разумным: модель автономной среды

10 hours 5 min ago

Существует ли такая задача или класс задач, в которых машина вынуждена демонстрировать разумное поведение, а не просто оптимизировать заранее заданную цель?

Читать далее

Бесплатные нейросети для фото: топ-5 ИИ-моделей для генерации изображений в 2026 году

10 hours 6 min ago

Кажется, в мире нейрогенераторов сейчас настоящая гонка вооружений. Каждый месяц выходит новая модель, каждая громче предыдущей кричит о “прорыве”, “фотореализме” и “понимании контекста”. OpenAI, Google, Black Forest Labs, Midjourney – все хотят быть первыми. Но кто из них действительно умеет работать со сложными, многосоставными сценами?

Мы решили не гадать, а провести честный эксперимент. Взяли один мегапромпт – с девушкой, двумя необычными спутниками, инопланетной атмосферой и кучей деталей – и прогнали его через пять топовых нейросетей 2026 года. Что получилось? Кто‑то блистательно справился, а кто‑то просто нарисовал милую открытку, проигнорировав половину условий.

Это не просто обзор – это битва алгоритмов, где победит тот, кто не просто рисует красиво, а думает, как художник. Итак, запускаем генерацию – и смотрим, чья нейросеть действительно готова к полету на другую планету в компании Крокодила и Зебры.

Включаем воображение и начинаем тест!

Читать далее

Трое в лодке, не считая контекста

10 hours 25 min ago

Как подружить MCP-сервер, клиент и LLM в вашем приложении - практическое руководство.

Всем привет! Меня зовут Владимир, последние несколько лет я занимаюсь разработкой приложений с использованием моделей  компьютерного зрения (CV), обработки естественного языка (NLP) и больших языковых моделей (LLM).

Буду делиться своими наработками в этих областях. Начнем с серии материалов про МСР

Читать далее

Минус $150k, потеря контроля в своей компании, сорванный экзит: 5 примеров последствий управленческого долга в стартапе

10 hours 30 min ago

В прошлой статье я описывал свой путь в качестве основателя стартап в Кремниевой Долине и вывел 12 уроков. Одни из наиболее «срезонировавших» тезисов того материала стал раздел про «управленческий долг». Я упомянул его вскользь, но на самом деле именно он стал тем фактором, который не позволил вырастить компанию до уровня в десятки миллионов долларов – хотя такой шанс в какой-то момент реально был.

Термин управленческий долг (management debt) я впервые увидел в книге Бена Хоровица – The Hard Thing About Hard Things. Бен – легендарный CEO (выводил компанию на биржу и продавал на $1млрд+) и сооснователь фонда Andreessen Horowitz, он умеет называть вещи своими словами.

Все похоже на техдолг – ты принимаешь удобное, «мягкое» решение сегодня, а завтра за него приходится расплачиваться с дикими процентами. И как и в случае с техдолгом, management debt может приводить к серьезным последствиям.

Ниже – 5 уроков о том, как я брал эти «кредиты», и как потом приходилось расплачиваться.

Читать далее

40 км ошибки: что бывает, когда слепо веришь искусственному интеллекту

10 hours 44 min ago

Для многих людей искусственный интеллект стал важной частью жизни: с ним советуются по поводу здоровья, психологических проблем, составляют планы питания и тренировок, дружат, пишут с ним исследовательские работы и т.д. Но мало кто задумывается о качестве информации, которую выдает ИИ, предпочитая слепо верить первому же ответу. В статье история моего личного провала.

Читать далее

Трёхстрочный Deep Learning: 20 примеров нейросетевой магии

11 hours 8 min ago

В 2012 году AlexNet потряс мир — тысячи строк кода, две видеокарты, недели обучения. Сегодня вы превзойдёте его одной строкой, а модель загрузится за секунды.

В статье — 20 полностью рабочих примеров глубокого обучения, каждый ровно в три строки Python. Анализ тональности, резюмирование текста, вопросно-ответные системы, генерация текста, перевод, NER. Детекция объектов, сегментация, оценка глубины, поиск изображений по описанию. Мультимодальные модели, которые отвечают на вопросы о картинках.
Это не упрощение и не обман. За тремя строками скрываются модели с миллиардами параметров: BERT прочитал всю Википедию, GPT-2 обработал 40 ГБ текста, CLIP просмотрел 400 миллионов пар «картинка-описание». Всё это знание теперь доступно через один вызов функции.

Никакой дополнительной подготовки данных, никаких конфигурационных файлов, GPU не требуется. Скопируйте код — и получите результат, на который ещё пять лет назад ушли бы недели. Те же модели прямо сейчас работают в production у Netflix, Google и тысяч стартапов.
К концу статьи вы освоите 20 техник, покрывающих большинство задач NLP и компьютерного зрения — и каждая уместится в твит.

Читать далее

Who's online

There are currently 0 users and 1 guest online.