Habr.com

Syndicate content Хабр
Все публикации подряд на Хабре
Updated: 1 hour 16 min ago

INSERT в StarRocks: как три кластера раскрыли цену commit protocol

1 hour 23 min ago

tl;dr:

Каждая операция INSERT несет фиксированный overhead (в наших тестах 64–99 ms), независимо от количества строк.

Формула: Total_time = N_statements * fixed_overhead + actual_write_time — подтверждена тестами.

1000 single-row INSERT = 64 секунды (Shared-data) или 100 секунд (Shared-Nothing).

Разница не в диске и не в Docker, а в протоколе commit: TxnLog + publish через BRPC против 2PC + publish_version.

В ANALYZE PROFILE commit overhead прячется в разнице TotalTime - ExecutionTime — это FE overhead.

Батчинг нивелирует разницу: при INSERT SELECT оба режима дают ~0.25 с на 1000 строк.

Читать далее

Кто такой SRE-инженер и чем он занимается в Авито

1 hour 27 min ago

Всем привет! Меня зовут Денис Захаров, я инженер в Автотеке Авито. В этой статье я расскажу о нелёгкой судьбе SRE на своём опыте: с чем я столкнулся в работе и как в общих чертах SRE-направление представлено в Авито. Статья будет полезна как разработчикам, так и малюткам, желающим узнать, что есть в мире IT. 

Читать далее

Волновой метод маршрутизации, технические предложения по использованию

1 hour 29 min ago

«Основным недостатком волнового метода маршрутизации является дополнительная нагрузка, которая создает­ся передачей поисковой посылки во все стороны, в том числе и в про­тивоположную сторону от УП». Поэтому предлагается некий локально-волновой метод маршрутизации, который «состоит в том, что для нахождения кратчайшего маршрута в сети между парой узлов из УИ организуется волновой поиск, но не во всех направлениях, а лишь в сторону УП».

Однако как автор волнового метода маршрутизации выражаю своё несогласие только с такой трактовкой возможностей волнового метода и поэтому предлагаю на конкретных примерах рассмотреть другие варианты.

Читать далее

Как родился и вырос метод квантового распределения ключей на боковых частотах

1 hour 40 min ago

ООО «СМАРТС-Кванттелеком» занимается разработкой и внедрением систем квантового распределения ключей (КРК), ориентированных не на лабораторные эксперименты, а на реальную телекоммуникационную инфраструктуру. В основе наших решений лежит метод квантового распределения ключей на боковых частотах фазовомодулированного оптического излучения КРКБЧ — subcarrier wave QKD (SCW-QKD). Сегодня этот подход используется в пилотных и промышленных квантовых сетях в Российской Федерации. Однако сам метод возник не вчера — его история насчитывает более двадцати лет и начинается с работ российских и зарубежных учёных середины 1990-х годов.

Настоящая статья открывает серию публикаций, посвящённых методу КРКБЧ и его эволюции — от физической идеи до практической телекоммуникационной технологии.

Читать далее

Как выбрать схему резервного копирования: от классики до экзотики

1 hour 46 min ago

Как известно, люди делятся на тех, кто делает бэкапы, и тех, кто пока ещё этого не делает. Однако и среди первых нет единства — существует множество подходов к организации резервного копирования. Сегодня мы расскажем, какие схемы бэкапа бывают, чем они различаются и когда стоит применять каждую из них.

За годы ИТ-индустрия выработала множество стратегий: каждая решает свои задачи и имеет собственную сферу применения — от простейших схем, подходящих для небольшой компании, до сложных многоуровневых систем, используемых в крупных организациях с требованиями к соблюдению регуляторных норм.

Читать далее

Эксплуатация пользователей: как цифровые платформы зарабатывают на эмоциях

1 hour 51 min ago

Можно ли сказать, что когда человек скролит ленты соцсетей, постит, ставит лайки, и пишет комментарии – он работает на компанию-владельца платформы?

С одной стороны абсурд.

С другой – все признаки трудовых отношений на лицо. Он вкладывает свое время, силы и ресурсы. Компания этот вклад монетизирует. А вместо зарплаты выдает “эмоции и удовольствие”.

— Я в этот инстаграм, как на работу хожу. — то и дело жалуются барышни.

Так и хочется съязвить: — А почему “как”?

Соцсети – не единственный тип бизнеса, который извлекает прибыль из таких “эксплуататорских” отношений.

В e-commerce, по типу Amazon, WB, Ozon или eBay – пользователи тоже привлечены на полный день. Пишут...

Читать далее

[Перевод] HotSpot AOT-кэш: стартуем быстрее, греемся меньше

1 hour 57 min ago

В новом переводе от команды Spring АйО рассмотрим, как можно ускорить Java-приложения без переписываний: в свежих JDK появились Ahead-of-Time оптимизации кэша, которые выносят «дорогие» этапы загрузки/линковки классов (и даже частично профилирование методов) из рантайма в заранее подготовленный артефакт.

Рассмотрим как устроен AOT-кэш в JDK 24–26, какие есть workflow (3 шага vs 2 шага/в один прогон), где прячутся подводные камни вроде удвоения требований по памяти при -XX:AOTCacheOutput, и какие практики обучения помогут реально сократить время старта и быстрее выйти на пик производительности.

Читать далее

Чиним замедление Telegram, за 1 команду

2 hours 5 min ago

Всем привет! Мы уже все понимаем, что блокировка Telegram будет в этом году. Сейчас власти делает это этапами, чтобы люди понемногу и без кипиша, мигрировали на Max. Понятно, что не все смогут или захотят это, но тут либо VPN либо более гуманная альтернатива - MTProxy.

Читать далее

Как мы создали систему интеллектуального поиска персонала с помощью виртуальных рекрутеров. Часть 1

2 hours 13 min ago

Приветствую, уважаемые хабровчане! Меня зовут Алексей Черепецкой, и я ведущий методолог Центра проектирования методологии и автоматизации службы кадровых ресурсов «Фикс Прайс». Сегодня расскажу, как вместе с коллегами из «Проф ИТ» мы смогли построить систему автоматизации найма с помощью роботов-рекрутеров.

Читать далее

Февральский «В тренде VM»: уязвимости в продуктах Microsoft

2 hours 22 min ago

Хабр, привет!

На связи Александр Леонов, ведущий эксперт PT Expert Security Center и дежурный по самым опасным уязвимостям месяца. Мы с командой аналитиков Positive Technologies регулярно исследуем информацию об уязвимостях из баз и бюллетеней безопасности вендоров, социальных сетей, блогов, телеграм-каналов, баз эксплойтов, публичных репозиториев кода и выявляем во всем этом многообразии сведений трендовые уязвимости. Это те уязвимости, которые либо уже эксплуатируются вживую, либо будут эксплуатироваться в ближайшее время.

С прошлого дайджеста мы добавили еще 2 трендовые уязвимости.

Читать далее

Безопасность Kubernetes: полный гайд для начинающих или как не повторить ошибку Tesla

2 hours 28 min ago

Kubernetes взламывают не «эксплойтом века», а банальностями: открытый доступ, cluster-admin «на время», default serviceAccount, секреты в манифестах (да, base64 не защита). Дальше сценарий предсказуемый — от тихого майнинга до утечки ключей, как в истории с Tesla.

В статье разберу три базовых опоры k8s-безопасности: минимизация прав через RBAC, нормальная работа с секретами и изоляция workload’ов через securityContext и политики — с типовыми ошибками и практиками, которые реально внедрить.

Читать далее

Собрать данные с автосимулятора: как Assetto Corsa стала источником живых данных

2 hours 30 min ago

229 заездов, 140 пилотов, 28 часов работы — столько данных мы собрали из Assetto Corsa за три дня SOC Forum 2025.

Мы превратили обычный гоночный симулятор в источник телеметрии: забирали данные из игры, строили дашборды в реальном времени и даже придумали ачивки для самых отчаянных пилотов.

Рассказываю, как устроен сбор данных из игровых симуляторов, что можно из них вытянуть и зачем это бизнесу.

Читать далее

Три агента, один репозиторий, ноль менеджеров. Как я построил конвейер, где ИИ пишет, ревьюит и деплоит код

2 hours 31 min ago

Месяц назад я закинул задачу на рефакторинг модуля авторизации и пошёл варить кофе. Кофе я допить не успел. Через двадцать минут пришло уведомление в ТГ: «staging обновлён, 94 теста пройдено, 0 упало».
Открыл репозиторий. Ветка, diff на два экрана. Code review от второго агента. Три замечания, два по делу. Третий агент прогнал тесты и задеплоил.
Код был чище, чем я обычно пишу по пятницам.
Но до этого момента были три месяца граблей, упавший продакшен, и одна ночь, когда агенты сделали десятки бесполезных коммитов. Обо всём по порядку.

Читать далее

Как я написал ASR-движок на Rust: от разочарования в одной модели до мульти-модельной архитектуры

2 hours 56 min ago

Привет, Хабр! В предыдущей статье я рассказывал, как портировал модель синтеза речи Qwen3-TTS на Rust. Тот проект (RustTTS) получился достаточно успешным — один бинарник, мгновенный старт, никаких Python-зависимостей.

Естественным продолжением стала обратная задача — распознавание речи (ASR, Automatic Speech Recognition). Логика казалась простой: у Qwen есть и TTS и ASR, архитектуры похожи, опыт с Candle уже есть, значит справимся за пару недель. Ну... не совсем.

Читать далее

Оптимизация обработки данных: как мы перестроили пайплайн с Apache Iceberg и S3

3 hours 18 min ago

Исходная задача и контекст

Перед нами стояла типичная для дата‑инженеров задача: обработать поток Parquet‑файлов с данными о внутренних технических процессах заказчика. Ключевой запрос — извлечь метаданные из таблицы, чтобы в дальнейшем работать с ними быстрее и удобнее.

В качестве основного инструмента мы выбрали Apache Iceberg — проверенный в наших проектах фреймворк для управления метаданными. Изначально пайплайн выглядел так:

Читать далее

Промежуточные результаты теста комбинаторных объявлений в Яндекс Директ

3 hours 21 min ago

C 6 ноября 2025 года комбинаторные объявления вышли в открытую бетку и стали доступны всем.Методика теста объявлений в мастере кампаний перекочевала в ЕПК. Ну или таки немножечко скопировали как художники у гугла адаптивные объявления. В анонсе показывали кейсы с увеличением конверсии до 55 процентов. Есть легкое недоверие к таким цифрам, да?

Но к черту голословный негатив, давайте к фактам. Я запустила чудо-новинку на нескольких проектах, потому что я любопытный человек и люблю тестировать. Потому что верю, что тесты — это путь оптимизации и повышения качества рекламы, аминь.

Читать далее

Порешаем интересные задачки по алгебре

3 hours 21 min ago

В этой статье мы немного отвлечёмся от практики и позанимаемся математикой, порешаем интересные задачки по алгебре (11 задач), конкретно по теории групп.

К сожалению, я не смог решить следующую проблему: я печатаю текст статьи в редакторе Word, но при этом формулы я не могу нормально отформатировать в нужный для Хабра Marktown

без ошибок. Буду рад, если кто-нибудь из читателей расскажет, как это можно сделать.

Основной текст статьи находится на Яндекс Диске, его (pdf файл) можно скачать по ссылке:

https://disk.yandex.ru/i/Xdf_NCBmnF9_zA

Читать далее

Топ-5 бесплатных нейросетей для транскрибации речи с помощью ИИ

3 hours 27 min ago

Представьте: вы провели часовое интервью, записали важнейшее совещание или наконец-то зафиксировали на диктофон ту самую гениальную идею, которая пришла за рулём. А дальше начинается самое «весёлое». Сидеть и вручную переводить всё это в текст, перематывая запись снова и снова. Минута аудио превращается в пять минут работы, а час записи съедает целый вечер. Знакомо? Ещё пару лет назад это была неизбежная рутина, от которой страдали журналисты, студенты, маркетологи и вообще все, кому приходилось работать с голосом.

Но нейросети перевернули эту игру с ног на голову. Сегодня искусственный интеллект расшифровывает аудио быстрее, чем вы успеваете допить кофе. Причём не просто выдаёт кашу из слов, а расставляет знаки препинания, различает спикеров, понимает акценты и даже справляется с фоновым шумом. Технологии, которые ещё недавно казались фантастикой, стали доступны каждому: загрузил файл, нажал кнопку, получил готовый текст.

Правда, есть один нюанс. Сервисов для транскрибации развелось столько, что выбрать подходящий стало отдельным квестом. Одни идеально работают с русским языком, другие только с английским. Одни бесплатные, но с ограничениями, другие стоят как подписка на стриминг, зато выдают почти идеальный результат. Какие-то умеют транскрибировать в реальном времени, а какие-то требуют загрузки файла и пары минут ожидания.

Мы протестировали и сравнили самые популярные нейросети для транскрибации, чтобы вам не пришлось тратить на это время. Разбираем плюсы, минусы, цены и неочевидные фишки каждого сервиса. Поехали!

Читать далее

Обратная разработка одного проприетарного алгоритма шифрования

3 hours 30 min ago

Одно время я занимался разработкой порта «Малой экспертной системы 2.0», который бы поддерживал базы знаний для этой программы и при этом был кросс‑платформенным. Программа поддерживала два формата: обычные базы знаний и шифрованные. Если с обычными базами знаний всё было более‑менее в порядке, то шифрованные базы знаний не поддавались ровно до тех пор, пока я не заглянул в машинные коды. В этой статье мы рассмотрим, как была реализована одна из схем сокрытия данных, основанная на принципе «безопасность через неясность».

Читать далее

Только 12,5% игр в «Стиме» получают пользовательский отклик

3 hours 37 min ago

Data-driven разбор рынка Steam 2021–2025

Каждый год десятки тысяч разработчиков выходят в Steam с надеждой, что их игра «найдет аудиторию». Платформа кажется демократичной: опубликуй игру, заплати сбор — и ты рядом с хитами. Но так ли хорошо у них дела? Данные говорят, что на деле Steam — это жесточайший рынок за внимание игроков, где либо ты привлек игроков на старте, либо тебя, вероятнее всего,  ждет забвение… 

Представляю результат анализа данных из Steam за 2021–2025 годы (≈65 000 игр).

Читать далее

Who's online

There are currently 0 users and 0 guests online.