Habr.com

Syndicate content Хабр
Все публикации подряд на Хабре
Updated: 1 hour 43 min ago

Победить дракона: что общего между Data Science и игрой Dungeons & Dragons

Tue, 03/10/2026 - 11:05

Что общего между броском d20 и проверкой гипотезы? Между походом в таверну за информацией и сбором данных от заказчика? Оказывается, довольно много.

Хабр, привет! Меня зовут Вячеслав Демин, я больше пяти лет работаю в сфере Data Science. Сейчас я руководитель направления аналитики данных в Сбере и эксперт на курсе «Специалист по Data Science» в Яндекс Практикуме. Начинал с этого же курса в 2020 году, после чего работал в сфере страхования и нефтехимии. 

А ещё я Dungeon Master в «Подземельях и драконах». В этой статье я расскажу, чем моя любимая игра похожа на мою работу и чем она может полюбиться дата-сайентистам.

Читать далее

Когда curl перестаёт работать: многоуровневый детект ботов и где в этой схеме живёт облачный браузер

Tue, 03/10/2026 - 11:01

Эта статья не о том, что Puppeteer плохой инструмент. Puppeteer — отличный. И грамотный TLS-фингерпринтинг вынесет большинство защит. Но есть класс задач, где даже идеальный сетевой стек не спасает — потому что детект давно приземлился на уровень поведения рендеринг-движка. Разберём, как Cloudflare и Akamai палят вас через WebGL и Canvas, и почему "чистый" код больше не работает.

Вскрываем антифрод

«Принеси‑подай, отвали и не мешай»: что такое агентность и почему менеджеру её не хватает

Tue, 03/10/2026 - 11:00

Бывает, менеджера нанимают на одну роль, а работать предлагают в другой. Например, в требованиях — нужен Delivery-менеджер: отвечать за поставку ценностей, сроки и результат. На практике — координируй, передавай задачу, уточняй статус. При этому команда менеджеру не подчиняется, приоритеты меняют тоже без него, а к заказчику доступ ограничен. Но зато если всё плохо — виноват менеджер, это его ответственность. 

Так выглядит работа с низким уровнем агентности. Это когда вы формально отвечаете за результат, а фактически — координируете чужие решения. В этом нет ничего плохого, если человека устраивает обычная административная роль. Но если от вас ждут управления и изменений, а полномочий и ресурсов не дают — всё обычно кончается конфликтами, выгорание и увольнение по причине «не сработались». И виноват в этом не менеджер. 

Я Степан Сорокин, Delivery Manager в Outlines Tech. За 10+ лет в ИТ я несколько раз попадал в компании, где ответственность отделяли от полномочий, а название роли не совпадало с реальной задачей. В статье разберу, что такое агентность в работе менеджера, почему её мало и что с этим делать.

Читать далее

AI-агент с долгосрочной памятью: строю личного аналитика с Claude Code

Tue, 03/10/2026 - 10:59

Разрабатываю AI-агента персональной аналитики для себя вместе с Claude Code. Любопытной инженерной задачей оказалась архитектура памяти. Как сделать, чтобы агент помнил не только последний разговор, но и паттерны, накопленные за месяцы? В этой статье описана архитектура, рабочие решения и грабли, на которые я наступила.

Doodling... Flowing... Analai... Manalai..

Мониторинг частоты упоминаний бренда в ChatGPT и Яндекс Алисе, карта ПДн вашего бизнеса — и еще 8 российских стартапов

Tue, 03/10/2026 - 10:45

Product Radar — здесь каждую неделю публикуются лучшие онлайн-сервисы и железки от русскоязычных команд. Это площадка, где энтузиасты из мира технологий делятся своими идеями, обсуждают и создают вместе новые продукты, чтобы делать жизнь людей лучше.

Читать далее

Воплощение it проекта в реальном производстве. Практический кейс из металлургии

Tue, 03/10/2026 - 10:33

Вот пример внедрения который я непосредственно воплощал, когда подхватил умирающий цех на металлургическом комбинате. Я планировал заняться улучшением технологии в сторону качества, в первую очередь улучшением механических свойств проката, геометрией, только всё это пришлось отложить. Хороший цех для наших реалий, запустили его только нещадно и показатели цеха были гораздо хуже того, как он бы мог работать даже при среднем уровне менеджмента.

Первое что меня сильно удивило когда начал вникать в цифры - цеховой баланс по металлу не сходился - цех получал заготовки значительно больше чем было годной продукции. Куда исчезала разница, на тот момент было непонятно. Пересчитал баланс - по отчётам цеха, по отчётам ОТК, технологов, экономистов цеха и других ситуация была стабильно средняя - средненькое качество продукции, с планом справлялись; только по отчёту коммерческих служб комбината мы не выполняли план по отгрузке продукции; это было сразу понятно по количеству завершённых контрактов. То есть цех работал, получал заготовку и ресурсы, продукция выпускалась, а вот с отгрузкой продукции потребителям были постоянные проблемы - мы не могли закрыть контракты в полном объёме, постоянно видели долги по поставкам продукции.

Изначально я переписал склад на бумагу, без особой точности - склад был забит браком, но кто и когда это сделал вообще не понятно. Имеет ли это отношение к текущему производству тоже не понятно, поскольку маркировка скрыта в горах такой продукции. То есть учётам тоже верить нельзя. С такого старта начал.

Читать далее

Конструктор табличных значений, UNNEST(), TABLE(), STRING_SPLIT(), JSON_TABLE() — замена временным таблицам в SQL

Tue, 03/10/2026 - 10:28

Бывают ситуации, когда есть список значений, и нужно найти значения, которых нет в БД. Прямым SQL-запросом найти отсутствующие значения невозможно, так как из базы нельзя получить значения, которых там нет. В статье рассмотрим какие есть замены временным таблицам в SQL.

Читать далее

Как уместить опыт в одностраничный PDF

Tue, 03/10/2026 - 10:16

Когда ты больше десяти лет в IT, кажется, что поиск новой работы — дело пары недель. Просто рассылаешь свой идеальный одностраничный PDF и ждешь приглашений.

Реальность - автоматические отказы еще до этапа знакомства с HR. Оказывается, впихнуть весь свой опыт в одну страницу под требования конкретной вакансии физически невозможно.

Нормальный человек в этой ситуации просто открыл бы Word и потратил сорок пять минут на ручные правки. Но я же инженер. Поэтому вместо отправки отклика я написал свою CMS для управления карьерным опытом и оптимизации резюме под вакансию.

Стоила ли неделя медитаций над консолью того, чтобы автоматизировать задачу, и как это взломало конверсию на первичном скрининге?

Читать далее

9 событий в мире ИИ, которые завирусились в соцсетях 24 февраля — 9 марта 2026 года

Tue, 03/10/2026 - 10:10

Самые трендовые события и полезные материалы по искусственному интеллекту за неделю. Без нудных технических релизов. Кратко.

Читать далее

Unreal Engine 5.4 + C++ + MacOS Tahoe + Android build = Build Successful

Tue, 03/10/2026 - 08:15

Небольшая инструкция для всех, кто работает в Unreal Engine и пишет на C++ или иных языках + компилирует файлы для Андроид.

Читать далее

Концепция кастомизированных ИИ-агентов как «виртуальных аватаров» человека

Tue, 03/10/2026 - 06:19

Статья посвящена концепции создания и эволюции кастомизированных ИИ-агентов, определяемых как «виртуальные аватары» (ВА) человека. ВА позиционируются как постоянно обучающиеся модели, «прикреплённые» к конкретным людям и способные выполнять умственную работу, принимать рутинные решения и действовать, исходя из индивидуальных предпочтений, интересов и установок своего владельца.

Средства искусственного интеллекта (ИИ) как фундамента следующего технологического уклада развиваются с неудержимой силой и стремительно входят в нашу повседневную жизнь. Становится всё более очевидным, что скоро наступит время, когда любую, в том числе заранее не объявленную, исполнительскую производственную задачу такие средства выполнят не хуже человека. А сопряжение этих средств с роботами, способными передвигаться по заранее не заданной сложной поверхности и выполнять заранее не заданные тонкие технологические манипуляции, даст возможность полностью ликвидировать и физический труд человека.

Что же тогда останется самому человеку? Производственная деятельность, где нужна персональная юридическая ответственность человека-специалиста? Участие в социальном целеполагании? Заведомо человеческое творчество и заведомо человеческая эмпатическая коммуникация? Формулирование и передача новым поколениям ключевых ценностей общества? То есть всё то, что нельзя переложить на искусственные субъекты мышления и деятельности? Ниже поразмышляем над этими и другими интересными вопросами...

Читать далее

Контракт вместо настроек: чего я жду от OLTP-БД

Tue, 03/10/2026 - 06:07

После первой статьи в комментариях несколько раз прозвучало примерно одно и то же:
"Всё правильно, но это же про любую зрелую СУБД — что с этим делать?"

Я думал над этим вопросом несколько недель. И в итоге решил не искать ответ в виде
"возьмите правильный инструмент X" — а попробовать честно сформулировать:
какими свойствами OLTP-БД должна обладать сама по себе, независимо от того,
насколько хорош ваш оператор, консультант или runbook.

Что такое "контракт" — и почему это не маркетинг

Попробую объяснить не через определение, а через ощущение.

Когда вы покупаете автомобиль, вы не читаете инструкцию к тормозам каждое утро.
Вы просто знаете: нажал педаль — машина тормозит. Это контракт. Он не зависит от того,
правильно ли вы настроили тормозную жидкость этим утром или не забыли включить
"режим торможения" в меню.

Читать далее

Тёмная сторона крипты, аномалии и управление тысячами роботов

Tue, 03/10/2026 - 05:24

Перед вами третья и последняя часть моей статьи про конференцию алготрейдеров в Москве. Часть 1 была про инфраструктуру, а часть 2 про практическое применение ИИ.

Третья часть будет о последствиях. Перед вами будут четыре доклада на одну тему:

* неэффективности,
* уязвимости,
* масштабирование систем.

А ещё в статье интересная торговая идея с дисбалансом внутри синтетического инструмента — целой корзины акций Мосбиржи.

Всё плохо?

Стики с эффектом Холла для неоригинального контроллера xbox 360

Tue, 03/10/2026 - 03:00

Купил я как-то контроллер для xbox 360, проводной, но не оригинальный. Очень уж мне понравилось, что в Windows 10 он определяется как родной, и в тех же старых GTA он определяется по умолчанию. Но было одно НО! Стики - шлак, просто полный. Движения рывками, характеристика рваная.

И тут зачесались руки

Как построить DWDM-сеть в России

Tue, 03/10/2026 - 02:57

Введение
В России построены десятки тысяч километров ВОЛС. Но каждый новый проект магистральной сети спотыкается об одни и те же грабли. Вендоры продают «терабиты» и «дальность», а заказчик потом годами мучается с эксплуатацией в условиях, где бригада может выехать на объект только через трое суток.
Этот текст - попытка посмотреть на строительство DWDM-сетей не глазами производителя, а глазами того, кто потом будет это обслуживать. Только логика и здравый смысл.

Часть 1. Терабиты vs реальное волокно. Рынок DWDM всегда живет в гонке скоростей. 10 Гбит/с, 40, 100, 400. Сегодня российские производители заявляют 40 Тбит/с на 1000 км - это впечатляет. Но для эксплуатанта есть обратная сторона медали: чем сложнее формат модуляции, тем он чувствительнее к внешним условиям.
Что происходит на реальной трассе:
Волокно 20-летней давности имеет микроизгибы и неоднородности.
Поляризационная модовая дисперсия(PMD) на старых линиях может «убить» 100-гигабитный канал, хотя 10-гигабитный будет работать годами.
Разница между лабораторным стендом и реальным пролетом в 300 км — это разница между идеальным вакуумом и открытым космосом. Нужен не тендер по рекламным брошюрам, а расчет реального энергетического бюджета.
Производитель должен предоставить не просто паспортную дальность, а инструмент для расчета: пройдет ли его сигнал на конкретном пролете заказчика с учетом реального затухания, реальной дисперсии и реального количества сварных соединений. Тот, кто дает заказчику честный прогноз «на этом участке 100G пройдут, а вот здесь только 10G, потому что волокно старое», - вызывает доверие. Остальные - просто продают коробки.

Читать далее

От бронзы к золоту. Методика управления ETL-процессами через сквозную нумерацию пакетов с данными

Tue, 03/10/2026 - 02:16

Всем привет.
Речь пойдет о методике ETL-процесса. Очень мало информации об этой важной области работы с данными. Я много раз видел на проектах, что в командах нет общего не то что фреймворка, а даже методики по загрузке данных. Либо есть, но у каждого разработчика своя. И те, что есть, не универсальны и не учитывают некоторые реперные точки. Иногда даже журнал загрузок не ведется. Созрела идея создать, перенести свою методику в питон код и поделиться. Начнем.


Когда мы создаем ETL- процессы основные требования: идемпотентность, обработка ошибок, целостность данных, инкрементальность, производительность, мониторинг, происхождение данных, и тд. Может еще что, но и этого достаточно.

Основные понятийные объекты в тексте: tech_query_id, tech_batch_id. tech_query_id – является штампом момента запуска pipeline, вручную или автоматически, не важно. Если запустили загрузку для терабайт данных, то и штамп будет всего один для этой конкретной загрузки. Штамп tech_query_id проставляется в каждой строке в самих таблицах с данными цели и в журнале. А так же проставляется tech_batch_id, который является обычным номером пакета. Понятно зачем пакеты.., если данных миллионы, мы их бьем по пакетам. Номер пакета для каждого query_id  начинается с единицы. Эта комбинация является ключом в таблицах с данными для трассировки происхождения и ключом в таблице журнала загрузок для фиксации метаданных, дельтапоинта и любой полезной информации в json поле.

Читать далее

Lexometrica Ground Truth: бенчмарк LLM по российскому праву

Tue, 03/10/2026 - 02:15

Всем привет! Делюсь итогом двухмесячной работы - релизом рейтинга юридического рассуждения больших языковых моделей Lexometrica Ground Truth.

Изначально цель была сугубо практической: требовалось выбрать лучшие модели для LegalTech-проекта "неШемяка!". Но в процессе пришлось столкнуться с фундаментальной проблемой индустрии оценки ИИ - открытые тесты дают сильно искаженную картину. Финальные результаты спроектированного стресс-теста оказались сколь ожидаемыми, столь же и неожиданными.

В этой статье описал, как архитектурно выстроен бенчмарк, как велась борьба с test-set leakage, почему написан кастомный пайплайн и какие глобальные и локальные нейросети на самом деле умеют legal reasoning.

Читать далее

Смена парадигм в нейрофизиологии: от рефлекторной машины к самоорганизующейся системе

Tue, 03/10/2026 - 01:51

Нейрофизиология долгое время развивалась в рамках представления о мозге как о системе передачи сигналов. Нейрон в такой модели рассматривался как элемент электрической цепи, а нервная система — как сложная сеть проводников, по которым распространяются импульсы. Подобная картина хорошо соответствовала открытиям XIX–XX веков, когда были описаны потенциалы действия, синаптическая передача и основные принципы нейронной связи. Однако по мере накопления экспериментальных данных стало очевидно, что эта модель не объясняет многих особенностей реальной мозговой активности. Исследования последних десятилетий показывают, что нервная система обладает собственной динамикой, способной генерировать сложные формы активности даже при отсутствии внешних стимулов. Это постепенно приводит к пересмотру классических представлений о работе мозга и формированию более сложной системной картины нейронных процессов.

Читать далее

Наблюдаемость LLM-агентов: Часть 1. Трассировка LangGraph и версионирование промптов с LangFuse

Tue, 03/10/2026 - 01:41

Привет, Хабр! Меня зовут Владимир и в последнее время я занимаюсь разработкой агентов на LangGraph. Отладка LangGraph-агента - это отдельная боль: когда граф начинает жить своей жизнью, а LLM уходит в бесконечные циклы, понять, что случилось, становится сложно. В этой статье я покажу, как связать LangGraph с LangFuse для трассировки и покажу как управлять промптами как кодом (версионирование и миграция).

Читать далее

Системная инженерия в бизнесе: архитектурный подход к построению компании, который корпорации применяют уже 50 лет

Tue, 03/10/2026 - 00:16

Эта статья — не про методологии вроде TOGAF или Zachman Framework в их классическом корпоративном понимании. Это про системное мышление применительно к построению и масштабированию компаний. Целевая аудитория: технические основатели, CTO, и тимлиды, которые выросли из «решаем проблему кодом» в «строим организацию». Я постарался подсветить выход из тоннеля.

Читать далее

Who's online

There are currently 0 users and 2 guests online.