Habr.com

Syndicate content Хабр
Все публикации подряд на Хабре
Updated: 33 min 59 sec ago

[Перевод] Как подбирать аугментации: гипотезы, протокол и метрики

11 hours 6 min ago

Новый пайплайн аугментаций редко собирается за один раз: базовые кропы и отражения, потом куски из старых проектов, статей и соревнований — и в какой-то момент уже много трансформаций, а ясной логики выбора нет.

Статья про то, как к этому подойти системно: зачем конкретная трансформация, что она симулирует, насколько сильно её включать и какое допущение о данных она закладывает. Ключевая мысль: аугментация — явное утверждение о том, какие вариации не должны менять смысл метки. Отсюда проще решать, что оставить и что убрать, и отличить реальную пользу от ситуации, когда обучение просто стало шумнее.

Без «волшебной таблетки»: не готовая формула, а интуиция, ментальная модель и пошаговый протокол для реальных систем. Внутри — инженерный взгляд, два уровня, пайплайн в семь шагов, настройка силы и бюджета, продвинутые приёмы, диагностика и метрики, признаки вреда, автопоиск, выкат и примеры.

Исходный гайд в документации. (Документация)[https://albumentations.ai/docs/] Репозиторий

Albumentations — открытая библиотека аугментаций изображений (15k+ звёзд на GitHub, 140M+ загрузок).

Читать далее

RAG или умный поиск по документам: как это работает

11 hours 20 min ago

Хотите за секунды находить точный ответ в сотнях закрытых корпоративных PDF, Excel и презентаций, вместо того чтобы часами копаться в «мусорном» поиске по ключевым словам?

В статье разберем новую архитектуру RAG — система, которая сначала молниеносно находит нужные куски документов по смыслу, а потом объясняет их человеческим языком строго по источникам, практически без галлюцинации.

В статье мы раскрыли всю «кухню» от семантической нарезки и эмбеддингов до HyDE, RRF и итеративного поиска — читайте и сразу пробуйте своего супербота на pro-talk.ru!

Читать далее

Как пережить блокировку GitHub-аккаунта и почему к ней лучше подготовиться заранее

11 hours 20 min ago

Как пережить блокировку Github-аккаунта

и почему к ней лучше подготовиться заранее

что делать, если вы не можете войти аккаунт и что стоит сделать, чтобы уменьшить последствия в случае блокировки

Читать далее

Max.ru Bot API: Пишем своего бота для обратной связи. Часть 1. MVP

11 hours 33 min ago

Привет, Хабр! С выходом платформы MAX у разработчиков появилось новое игровое поле. Пока комьюнити спорит о шансах на победу в гонке мессенджеров, маркетологи уже начали переливать туда трафик.

Самая типовая задача для бизнеса сейчас — бот обратной связи. В Telegram эту нишу давно занял Olgram, а вот в Max — чистый лист. Давайте вместе напишем свой аналог. Это отличный кейс, чтобы разобраться с новым API, не углубляясь в лишнюю инфраструктуру.

Стек: Почему все оказалось проще, чем кажется

Для MVP (Minimum Viable Product) мы будем использовать Node.js и официальную библиотеку @maxhub/max-bot-api.

Читать далее

Я протестировал 30+ голосовых AI-движков и собрал переводчик быстрее Google Meet. Бенчмарки, цены, грабли

12 hours 35 min ago

30+ движков за две недели, реальные замеры на Apple M4, и почему ElevenLabs за $5.57/час — это приговор для бизнеса

Сижу на очередном рабочем созвоне. Обсуждаем архитектуру нового сервиса. Технически я всё понимаю — документацию на английском читаю без словаря, код ревьюю, в слаке переписываюсь нормально. А вот когда надо открыть рот и сказать что‑то сложнее «I agree» — начинается цирк. Пауза. Подбираю слова. Коллега уже ответил за меня.

Знакомо?

Я CTO, серийный предприниматель, последние годы плотно работаю с AI‑интеграциями. И вот парадокс: могу собрать систему автоматического обзвона клиентов с клонированием голосов, а сам на созвоне звучу как иностранец с разговорником.

Решил наконец закрыть этот гештальт. Полез искать real‑time переводчик. Что‑то типа: я говорю по‑русски, собеседник слышит английский. И наоборот. В реальном времени, без пауз на 10 секунд.

И тут началось интересное.

Читать далее

Как выучить Active Directory и групповые политики

14 hours 3 min ago

Темы статьи

1. Аналог AD DS: Samba DC

2. Активация, лицензирование и законодательство

3. Правильный подход и автоматизация

4. Список литературы, методы её изучения

5. Синхронизация времени в домене

6. 50 примеров задач, решаемых при помощи GPO

Читать далее

Реставрация ruGPT-3 XL или как я вернул к жизни забытую русскую языковую модель

17 hours 24 min ago

Несколько дней к ряду я занимался реставрацией легаси модели ai-forever/rugpt3xl, это классическая языковая модель от SberDevices на 1.3B параметров, крошка по современным меркам, на которой сберовцы обкатывали свои научные наработки аж в далёком 2021м году. Подробнее о ней можно почитать в статье “A family of pretrained transformer language models for Russian” на Google Scholar.

Да, она foundation, то есть умеет только продолжать текст, не может выполнять инструкции или работать в режиме чата. Но обучена она на корпусе русского языка и этот самый русский генерит очень бодро. У неё есть две примечательные особенности: её обучали с нуля, архитектура представляет собой глубокую модификацию GPT-2.

Читать далее

[Перевод] Полный текст интервью Теренса Тао: Кеплер, Ньютон и подлинная природа математического открытия

18 hours 43 min ago

Перевод на русский полного текста свежего (20 марта 2026) интервью Дваркешу Пателю интересного собеседника, Теренса Тао, величайшего математика нашего времени (разумеется, величайшего наряду с Григорием Перельманом) о том, чему нас учит история великих астрономических открытий и как ИИ даёт возможность ускорить математические исследования.

Это лонгрид, часовое интервью. Но несмотря на длительность, я настоятельно рекомендую прочитать его всем интересующимся: математикой, физикой, астрономией, ИИ, историей науки и тем, как на самом деле делаются научные открытия...

Читать далее

Кажется, во мне умирает программист

18 hours 58 min ago

AI должен был сделать мою работу легче. Он сделал. Только вместе с этим куда-то пропало ощущение, что я вообще что-то создаю

Читать далее

Как найти работу продакт-менеджеру

19 hours 21 min ago

Несколько раз в своей жизни, я был в ситуации, когда нужно было срочно искать работу и я навсегда запомнил таблицу из 500 откликов, которые я сделал без единого приглашения на собеседование. Находясь в той ситуации, все внутри меня кричало о том, чтобы кто-то помог мне, выступил опорой и указал на ошибки. 

В надежде на то, что эта статья будет полезна тем, кто сталкивается с трудностями при поиске работы, особенно продакт-менеджерам, кем и являюсь сам. Тем, кто делает сотни откликов без обратной связи, сталкиваясь с немым вопросом.

По какой-то причине в России мало говорят в университетах, курсах про поиск работы. А если и говорят, то в основном, это вырванная из общего контекста информация без деталей, которые, в данном случае, имеют большое значение.

Подчеркну, статья будет смещена в область продакт-менеджмента и примеры будут для этой профессии. Однако, подавляющее большинство рекомендаций применимы практически для любой специальности

Читать далее

ПИД-регулятор — это весело

19 hours 23 min ago

Давайте исследуем ПИД-регулятор через пень-колоду: FDTD, численное интегрирование, ракету и самобалансирующегося робота! Ворох нечитаемого кода! Мало не покажется

Читать далее

Какими инструментами пользуется бизнес-аналитик в 2026 году

19 hours 33 min ago

Современный бизнес-аналитик 1С занимается не только сбором требований заказчика и передачей их разработчику. Эта роль стала шире: здесь требуются и навыки проектного управления, и понимание архитектуры решений.

Наталья Китавина, аналитик проектов 1С Ресурсного центра Инфостарта, рассказывает, какими программами сегодня пользуются аналитики и как подобрать инструментальный стек под свои рабочие задачи.

Читать далее

Как не устроиться в Яндекс на работу потратив 2 месяца

20 hours 34 min ago

В середине января 2026 со мной связался рекрутер с заманчивым предложением присоединиться к команде Яндекс по программе Мультитрек.
Мультитрек это просто: вы по одному месяцу работаете в трех разных командах и потом выбираете к какой команде присоединиться.
С конца прошлого года нахожусь в поисках работы и развиваю собственные проекты.
Как многим известно, рынок труда в части ИТ очень изменился. Год-два назад я получал по паре приглашений в месяц даже при условии того, что мое резюме было снято с публикации. Сейчас количество приглашений на собесы стремится к нулю.
Почитал про Яндекс как про работодателя - да написано много негатива про собеседования, но с другой стороны программами Яндекса я пользуюсь постоянно - это и Яндекс Музыка и Такси так что я решил себя попробовать на этом поприще.
Вот что было предложено пройти : https://yandex.ru/jobs/interview/backend#tech-content

Испытание 1: Базовые технические навыки (Алгоритмы).
Для меня это было самым тяжелым испытанием. До сих пор уверен, что та теория которая дается в рамках курса Теории алгоритмов не встречается на реальных рабочих проектах. По крайней мере не встретились мной за 25 лет практики. А если и встречаются, то у тебя есть несколько дней а чаще недель на то, чтобы погрузится в задачу такой сложности. Здесь же нужно решить две алгоритмические задачи на скорость: 2 задачи за 1 час.
Внутренний протест заниматься бесполезным занятием был очень высок, но, во первых других предложений по работе небыло, а во вторых пошел с собой на компромис со словами о том, что эти знания меня не портят и даже делают сильнее.
Было еще третье - внутренний вызов. Тварь я дрожащая или лидом и сеньором (помидором) по джава имею право называться и вот он шанс еще и самому себе объективно подтвердить свой статус приняв вызов и очередной раз побиться за этот чемпионский пояс.
Попросил на подготовку 2 недели и в режиме нон-стоп начал изучать саму теорию и практиковаться на сайте litcode - выбрав раздел топ-100 задач для собеседований. Голова просто разрывалась от количества информации вкачанной туда слишком быстро. Возможно здесь есть еще такие старперы как я, кто помнит фильм Джонни-Мнемоник - вот там очень хорошо показано то, что испытывал я на себе в процессе этой подготовки.
Сдал с хорошей обратной связью.

Читать далее

Как собрать систему захвата ниши: семантика, архитектура сайта, LLM-пайплайн и подготовка к AI-поиску

21 hours 15 min ago

SEO‑индустрия умеет делать две вещи особенно стабильно. Во‑первых, каждые несколько лет торжественно объявлять свою смерть. Во‑вторых, продавать одни и те же хаотичные процессы под новыми словами. Раньше это называлось «контент‑маркетинг», потом «topic clusters», потом «programmatic SEO», теперь на сцену влетели LLM, AI Overviews, GEO, AEO и еще десяток аббревиатур, от которых у любого редактора дергается глаз.

На этом месте обычно появляется очередной бодрый тред в духе «SEO умерло, теперь нейросеть сама все сделает». Потом кто‑то идет в ChatGPT, просит «собери семантику по нише», получает 400 красивых галлюцинаций, 120 дублирующих друг друга страниц, 30 заголовков в стиле «Купить купить купить недорого цена» и торжественно называет это pipeline.

Проблема, конечно, не в LLM. Проблема в том, что хаос не становится системой только потому, что вы добавили к нему API‑ключ.

Если упростить весь тезис статьи до одной мысли, то она будет такой: захват ниши начинается не с контента и не с промпта «сделай мне хорошо». Он начинается с инженерии спроса. С понимания того, какие интенты вообще существуют в рынке, какие типы страниц им соответствуют, где нужна коммерческая посадочная, где фильтр, где сравнительная страница, а где честнее вообще ничего не создавать.

В этой статье я хочу разобрать не набор SEO‑ритуалов и не коллекцию модных слов про AI, а рабочую систему. Ту самую, в которой семантика перестает быть кладбищем таблиц и превращается в управляемый пайплайн: от сырых запросов до кластеров, от кластеров до структуры сайта, от структуры до страниц, а от страниц до понятного плана разработки, контента и AI‑видимости. Это не теоретическая экскурсия и не набор “полезных советов”. Это схема процессов, которую можно адаптировать под реальную нишу, реальный сайт и реальный production.

Читать далее

OSINT для ленивых. Часть 6: Фотошоп наше все? Выявляем фейк за 2 минуты

21 hours 31 min ago

О метаданных файлов изображений мы уже говорили и не секрет, что их тоже можно редактировать, в том же Exif-pilot, например. Как распознать фейк, если метаданные на изображении корректные? Кэп очевидность утверждает, что только анализом контента. Логично.

— Возьмем какой-нибудь файл с зачищенными метаданными и проанализируем его на предмет манипуляций в Фотошопе или еще каком-нибудь редакторе. В том же Пейнте :)))

Закинем его на уже упоминавшийся https://29a.ch/photo-forensics и посмотрим, что он нам расскажет. Самый верхний пункт меню — Magnifier/ Увеличилка, чтобы можно было глазками прошерстить картиночку и пальчиком везде потыкать: вдруг кто-то неаккуратненько подработал. Но такое можно не только тут.
Нас интересует другая опция в меню: Clone Detection — детектор клонов показывает применение инструмента типа "штамп" при обработке, он выделяет клонированные участки розовым светом. Как видно, тут этого добра преизрядно.

Читать далее

IT-премия умерла? Что делать удалёнщику до 2030

21 hours 41 min ago

Умерла ли IT-премия или же покидает мегаполисы? Разбираемся, что происходит с зарплатами, промышленностью и AI-автоматизацией одновременно — и строим четыре сценария для удалёнщика до 2030. Внутри: почему сварщик догоняет программиста по зп, как выглядит ликвидационизм без лишней теории, и шесть пунктов стратегии, которая работает при любом раскладе.

Читать далее

VLESS на роутере с OpenWRT

Fri, 03/27/2026 - 23:51

Небольшая инструкция по установке VPN (протокол VLESS), на роутер с операционной системой OpenWRT с использованием пакета Passwall

Читать далее

R-Style Softlab: Telegram вчера и сегодня что изменилось для бизнеса

Fri, 03/27/2026 - 23:44

В России продолжает формироваться правоприменительная практика в отношении использования Telegram, в том числе в части размещения рекламы. Позиция регуляторов в последние месяцы изменилась, что создало дополнительную неопределённость для бизнеса.

Ранее Федеральная антимонопольная служба указывала, что размещение рекламы на ресурсах с ограниченным доступом, включая Telegram, подпадает под признаки нарушения законодательства о рекламе. В соответствии с частью 10.7 статьи 5 закона «О рекламе» распространение рекламы на таких ресурсах не допускается, а ответственность несут как рекламодатель, так и рекламораспространитель.

Впоследствии ФАС скорректировала подход и фактически допустила размещение рекламы в Telegram, установив переходный период до конца 2026 года. При этом само по себе такое смягчение не означает снятия правовых рисков и не меняет базовой логики регулирования.

Существенное значение в текущей ситуации приобретает вопрос квалификации информации как рекламы. В соответствии с действующим законодательством РФ, рекламой признаётся информация, направленная на привлечение внимания к объекту и его продвижение на рынке. В то же время новостные, аналитические и справочные материалы, не направленные на продвижение, а также публикации на собственных ресурсах компаний, при отсутствии стимулирования интереса к конкретному продукту, рекламой не являются.

По мнению юриста R-Style Softlab Максима Сектименко, текущая ситуация требует осторожного подхода со стороны бизнеса, несмотря на формальное смягчение позиции ФАС. 

Читать

Читать далее

Как сохранить данные из Телеграма

Fri, 03/27/2026 - 23:21

В этой статье я расскажу об одном свободном и бесплатном инструменте, позволяющем выкачать из популярного мессенджера Телеграм и сохранить на вашем компьютере данные из ваших любимых групп, каналов и диалогов.

Представленный здесь инструмент не единственный, но, возможно, один из самых простых и удобных. Это не бот: запросы к серверу будут выполняться от вашего имени, что гарантирует доступ к тем чатам, которые видите вы сами.

Читать далее

Как я хотел одного AI-агента, а получил целую деревню

Fri, 03/27/2026 - 22:58

Всё началось с простого желания: чтобы AI-агент мог потихоньку развивать мои проекты, пока я занят другими делами. Поставил задачу, ушёл, вернулся к готовому результату. За неделю из этого желания выросла мультиагентная система с шиной сообщений, мониторингом, делегированием задач и собственной веб-админкой. Система, которая в значительной мере построила сама себя.

Под катом: путь от первого запуска Claude Code до деревни из двенадцати агентов, каждый хак и каждые грабли на этом пути, и неожиданное открытие, что менеджмент AI-команды устроен ровно так же, как менеджмент живых людей.

Читать далее

Who's online

There are currently 1 user and 1 guest online.