NER часто воспринимают как задачу классификации токенов: BIO-теги, последовательности меток, декодирование. Такой взгляд удобен с точки зрения моделей, но плохо отражает то, как NER работает в реальных системах.
Сущности - это не токены, а фрагменты текста. Результаты работы NER-систем, как правило, представлены в виде спанов - с явными границами начала и конца (start / end) и типами сущностей.
В этой статье мы разберём два уровня разметки в NER: span-level и token-level
и покажем, какую роль каждый из них играет в практических пайплайнах.
Подводные оптоволоконные кабели в наше время — один из ключевых факторов, определяющих развитие глобальной сети. Рост дата-центров, облачных платформ и распределенных вычислений резко увеличил нагрузку на магистрали, а требования к задержкам и устойчивости стали жестче, чем когда-либо.
Если раньше кабели тянули по ситуации — закрыть разрыв, подключить регион, уложиться в бюджет, — то сейчас их проектируют заранее под конкретные точки роста. Новые линии сразу рассчитывают на десятки терабит в секунду и жестко привязывают к крупным дата-центрам, облачным регионам и вычислительным кластерам. К этому добавилась география и политика: независимые маршруты, резервные пути и снижение рисков стали важными факторами проектирования.
Читать далееВ прошлой статье я поделился опытом, как я писал с помощью ИИ кастомный TO-DO лист под macOS. Опыт оказался противоречивым, однако приложение было создано, и оно даже работало.
Поэтому я решил расширить идею, добавить фана и реализовать мечту любого программиста — написать собственную игру. И так как у меня уже появилось небольшое понимание экосистемы десктоп-приложений под macOS и SwiftUI, я решил использовать его.
Читать далееНедавно разбирали с заказчиком вопрос, который показалось важным разобрать в подробной статье так как в рамках телеграмм-канала формат подробности не допускает: «Можно ли написать одну политику обработки персональных данных, которая закроет сразу всех - и сотрудников, и клиентов, и контрагентов?»
Звучит привлекательно: один документ вместо трёх, меньше бумаги, меньше согласований. Но когда начинаешь копать в требования 152-ФЗ, выясняется, что такая «экономия» может обойтись очень дорого. Давайте разберем риски и, что можно все таки сделать.
Летом мне попалась статья Вадима Башурова «История игрушки» 2011 года про создание игры «Поле Чудес» в далёком 1992 году — очень рекомендую, если вы, как и я, ее пропустили. Вадим упомянул, что исходники, к большому сожалению, утерялись. Мне очень захотелось восстановить их хотя бы в каком‑то виде, и я решил заняться этим на досуге.
Цель простая: кросс-компилируемый 16-битный .exe для MS-DOS, который повторяет логику оригинала и использует оригинальные ресурсы.
Статью я построю как небольшой туториал по реверсу 16-битных DOS‑приложений для начинающих и пройдусь по ключевым алгоритмам и тому, как в игре реализован игровой процесс. Желательны базовые знания 16-битного ассемблера и C.
Читать далееВ январе 2026 года информационная служба Хабра выпустила 842 публикации (801 новость и пост, 8 лонгридов и 33 перевода). В текущем дайджесте представлены лучшие технические новости, переводы и лонгриды (отдельные большие публикации) инфослужбы Хабра, согласно оценкам пользователей.
Читать далееДля многих важна эффективность, и это неудивительно — ведь достичь своих целей при минимальных ресурсах звучит здраво. Но психика как обычно делает сальто-мортале, и внезапно эффективность становится не более чем эффективным способом слить жизнь в унитаз.
Читать далееШироко распространенный метод относительной фазовой модуляции имеет недостатки по сравнению с абсолютной фазовой модуляцией: необходимость передачи пилот-сигнала в начале сеанса связи, меньшая помехоустойчивость, более сложная аппаратная реализация. Кроме того, при случайном скачке фазы искажается не только текущий символ, но и следующий за ним, а исправление двукратной ошибки требует применения корректирующего кода с большей исправляющей способностью. Однако абсолютная фазовая модуляция, несмотря на ее преимущества, почти не используется из-за переключения в режим «обратной работы» при перескоке фазы опорного сигнала. Решение проблемы применения абсолютной модуляции дает рассмотрение явления «обратной работы» в терминах помехоустойчивого кодирования, с точки зрения которого «обратная работа» – это совокупность пакетных ошибок, количество которых может достигать 100% длины передаваемого кодового слова. Для большинства помехоустойчивых кодов исправление более 50% пакетных ошибок является нерешаемой задачей, но голографический позиционный код дает совпадающий результат декодирования, как для прямого, так и для инвертированного блока данных. Далее описан мягкий декодер голографического кода, обеспечивающий безошибочное декодирование сигнала с абсолютной фазовой модуляцией без использования опорного сигнала при скачках фазы до двух раз за время приема одного блока данных.
Из теории связи известно, что фазовая манипуляция (ФМн) характеризуется высокой помехоустойчивостью. В 1946 г. В. А. Котельников в своей докторской диссертации "Теория потенциальной помехоустойчивости" доказал, что сигнал ФМн с манипуляцией на 180° является наилучшим способом передачи двоичных сигналов и достигает потенциальной помехоустойчивости. Однако реализация демодулятора для когерентного приема такого сигнала затруднена необходимостью поддержания равенства фаз опорного генератора и приходящего сигнала. В практических схемах опорный сигнал формируется из принимаемого колебания. При этом все схемы формирования опорного сигнала таковы, что вследствие различных неконтролируемых факторов возможны случайные изменения знака опорного сигнала. Это означает, что символы, регистрируемые на выходе приемника, даже при отсутствии аддитивной помехи в канале после случайного перескока фазы опорного сигнала инвертируются. Это будет продолжаться до следующего перескока фазы опорного сигнала. Возникает так называемое явление «обратной работы», которое сильно ограничивает применение в системах связи абсолютной ФМн (АФМн). Поэтому АФМн на 180°, хотя и обеспечивает максимально возможную помехоустойчивость радиосвязи, на практике не используется из-за «обратной работы» когерентного детектора.
Читать далееВ большинстве туториалов по Java-ботам нам предлагают написать EchoBot или магазин пиццы на огромных switch-case конструкциях. Но в 2026 году, когда у нас есть Java 21 и Spring Boot 3, писать бойлерплейт — это преступление против продуктивности.
Сегодня мы напишем WeatherBot — полезного бота, который показывает реальную погоду через API OpenWeatherMap, имеет кнопку обновления "на лету" и, используя FSM (Машину состояний) с валидацией данных, позволяет настроить ежедневную рассылку прогноза.
Читать далееГигантские серные бактерии — это крайне необычные организмы. Вы когда-нибудь задумывались, каким был бы мир, в котором они господствовали бы? Недавно я написал статью об этом гипотетическом сценарии, и мои коллеги из турецкого научного издания GazeteBilim попросили меня рассказать им некоторые дополнительные подробности. Здесь я представляю переведенную версию этого очень приятного интервью — с любезного разрешения моих турецких коллег
Читать далееВместо готового ИК-пульта решил собрать свой: ESP32, ИК-диод, транзистор, аккумулятор и расчёты для питания. Пошаговый мануал с фотографиями и подробным описанием всех этапов в духе DIY-статей, включая схемы, интеграцию с Алисой и разбор типичных проблем.
Читать далееДокументация по RRPP у Huawei обширная, но разобраться в ней с первого раза — то ещё приключение. Собрал в одном месте всё, что нужно знать про защиту кольцевых топологий: от базовых понятий до подводных камней при работе с несколькими кольцами.
Пролистать и забитьПривет, Хабр! Сегодня хочу поделиться историей о том, как желание автоматизировать рутинную работу привело меня к созданию собственного инструмента FullMute и, как следствие, к первым серьезным выплатам на платформах bug bounty.
Как многие начинающие исследователи, я начал с хаотичного ручного поиска уязвимостей: проверял заголовки, искал известные пути к админкам, пытался угадать версии CMS. Это было неэффективно, медленно и сильно зависело от везения. Мне нужен был «компас», который бы проводил первоначальную разведку за меня и давал четкие цели для атаки. Так родилась идея FullMute.
Читать далееВводные данные: год назад я, как и многие, скептически относился к искусственному интеллекту, считая его лишь набором «умных» запросов к интернету. После нескольких разговоров с публичной нейросетью меня поразили её способности, но мои коллеги по‑прежнему уверенно утверждали, что ИИ – это просто огромная база данных. Я собрал собственный сервер, запустил локальную нейросеть без доступа к сети, но даже предложение протестировать её на моём GPU‑сервере никого не заинтересовало. Что скрывается за этим скептицизмом? Почему люди отрицают возможности ИИ, хотя внутри уже чувствуют тревогу перед неизвестным?
Читать далееЧто было интересного в 2025 году по безопасности ИИ? Помимо развития AI-агентов и их протоколов, гардрейлов, и появления фреймворков, для российского рынка важно отметить появление нескольких новых официальных документов. О них и поговорим, так как я искренне считаю, что они выводят нашу нормативно-правовую базу на уровень одной из самых развитый и проработанных в мире. Но этот пост - не просто обзор)
Я расскажу и о своих соображениях о том, как управлять доступом AI-агентов, данными для GenAI-систем, и уязвимостями таких систем.
Если Вы до сих пор не перешли с *ngIf, @Input() и ChangeDetectorRef на @if и signal/computed/effects, но подумываете об этом, то прошу под кат. Предполагается, что вы уже имеете опыт в Angular. В статье - небольшая выжимка практического опыта.
Читать далееБудущее не приходит плавно. Оно не развивается по дорожным картам и не следует презентациям с KPI и отчётам Маккинзи.
Оно появляется в тот момент, когда инженер честно говорит:
«В рамках текущей логики это невозможно», и вдруг оказывается, что проблема не в физике, а в самой логике.
Эта статья не про гаджеты будущего, не про стартапы и не про «прорывные инновации». Она про метод мышления, который позволяет работать с технологиями там, где улучшать уже нечего.
В чём особенность обычной инженерии
Классическая инженерия работает отлично, пока рамка задачи верна.
Есть:
Читать далееЯ создал лексер ассемблера ARM64 (ну, точнее, сгенерировал его из моего собственного генератора парсера, но пост не об этом), обрабатывающий код на Dart вдвое быстрее официального сканера. Этого результата я добился при помощи статистических методик надёжного измерения малых различий в производительности. Затем я провёл его бенчмарк на 104000 файлов и обнаружил, что узким местом был не мой лексер, а ввод-вывод. Это история о том, как я случайно узнал, почему pub.dev хранит пакеты в виде файлов tar.gz.
Читать далееПока вы спорите о скруглении углов в новой дизайн-системе и попиваете лавандовый раф, где-то в Челябинске ослепленный бликами от раскаленной стали оператор пытается разглядеть ваш элегантный серый шрифт на мониторе 2012 года выпуска. Спойлер: у него не получается.
Дизайнеры, приходящие из разных сфер в Heavy Digital, совершают одни и те же ошибки. Они становятся очевидными только тогда, когда ты снимаешь белые кроссовки, надеваешь каску, проходишь инструктаж по технике безопасности и заходишь в реальный цех.
С 2020 года я набила достаточно шишек, пытаясь подружить стерильную эстетику Figma с суровой реальностью ГОСТов и промышленных мониторов.
Добро пожаловать в цех! Разберем по полочкам, как не провалить проект на этапе компонентов.
Читать далееПрофессор Стэнфордского университета Илья Стребулаев и эксперт по технологиям и инновациям Алекс Данг — авторы книги «Венчурное мышление». Их книга не является инструкцией по тому, как стать венчурным инвестором. Она о том, как логика и подходы венчурных инвесторов могут быть полезны любому, кто принимает решения в условиях неопределённости, нестандартных задач и ограниченной информации.
В основе книги — сотни интервью с предпринимателями и специалистами из разных сфер, а также многолетние исследования Стребулаева, включая анализ данных о стартапах-«единорогах» с оценкой от $1 млрд.
Читать далее