Все говорят про embedding-модели в RAG: бенчмарки MTEB, размеры моделей, chunking-стратегии. Но никто не задаёт главный вопрос: а сколько вообще документов может найти single-vector retrieval?
Google DeepMind посчитали. Оказалось, что даже 4096-мерные эмбеддинги упираются в математический потолок — есть задачи, где они физически не смогут найти нужный документ из топ-2, даже если модель идеально обучена.
В статье разбирается исследование LIMIT, показаны примеры, где dense retrieval проваливается (а BM25 справляется), и объяснено, почему для production-систем нужен гибридный поиск, а не слепая вера в SOTA-эмбеддинги.
Читать далееКультура непрерывного обучения в поддержке — это не «провести тренинг раз в квартал». Это встраивание постоянного развития в ежедневную работу так, чтобы всем казалось, что иначе и быть не может. В современных компаниях обучение перестаёт быть разовой акцией по необходимости и становится системой. Руководитель в этом процессе меняет роль: вместо «организатора тренингов» он становится «строителем среды», в которой знания постоянно рождаются, обновляются и применяются.
Читать далееПродактов часто спрашивают:
«С чего начать дерево метрик?» и почти сразу —
«А можно ли строить бэклог без него?»
Формально — можно.
Практически — тогда бэклог быстро превращается в набор идей без системы.
Эта статья — о том, как дерево метрик связывает стратегию, эксперименты и ежедневные продуктовые решения, и почему без прокси-метрик эта связь не работает в реальном времени.
Читать далееУ вас есть продакшен-сервер. Он спокойно работает часами. А потом внезапно падает. Без предупреждения, без graceful-деградации. Просто мёртв.
Виновник? Одна строчка кода, которая выглядит совершенно безобидно...
Читать далееЕсли оглянуться на последние пару лет, легко заметить: рынок компьютерного железа научился выживать в режиме постоянных встрясок — то майнинг, то пандемия, то еще что-нибудь. Но нынешний кризис оказался каким-то особенно упорным. Все началось с оперативной памяти: к концу 2025 года цены на обычные модули DDR5 в отдельных сегментах выросли в несколько раз и с тех пор продолжают ползти вверх. И это, похоже, не временный скачок. «Идеальный шторм» дефицита электронных компонентов не только не утих, но со временем стал лишь набирать силу. Давайте разберемся, в чем тут дело и есть ли шансы, что ситуация придет в норму.
Читать далееКогда чиновники из испанской Генеральной дирекции дорожного движения придумывали обязательные "умные" маячки V16, они явно представляли себе будущее в духе умного города: водитель попал в аварию, нажал кнопку, и вся инфраструктура мгновенно узнала о проблеме. Дорожные табло предупреждают других участников движения, навигаторы прокладывают объезд, службы спасения уже в пути. Красиво, да?
Вот только никто не учел, что первыми на место происшествия начнут приезжать не полицейские или дорожные службы, а предприимчивые ребята с эвакуаторами, украшенными липовыми логотипами страховых компаний. Под катом нас ожидает увлекательная поездка в мир, где обязательная IoT-безопасность превратилась в аналог меню для грабителей с доступом по API.
Привет, Хабр! Пока кто-то думает, что полеты к другим небесным телам слишком дороги, в Америке уже давно посчитали: они обойдутся не дороже МКС, от которой, соответственно, американцы хотят избавиться. Но если здесь с расчетами у США все хорошо, то вот место, куда они планируют высадить своих астронавтов через 2,5 года выбрано не очень продуманно. На самом деле оно находится в точке, прямо противоположной нужной.
Меня зовут Александр Березин, я научный журналист и автор команды спецпроектов МТС Web Services. Пока весь мир напряженно следит за земными планами американцев, я решил обратиться к куда более важной для будущего теме: их высадке в предположительно самой богатой ресурсами и научными данными части Луны. Ну или им так кажется — скоро читатели сами составят представление о том, насколько это верно.
Читать далееДелимся практическим кейсом рефракторинга автотестов учетной системы: от линейных скриптов к архитектурному подходу, который ускорил написание тестов в три раза.
Технический долг в автотестах — это катастрофа, которая нарастает незаметно. Сначала «простые и быстрые» линейные скрипты кажутся хорошим решением, но с ростом продукта они превращаются в «спагетти-код», где любое изменение в интерфейсе вызывает часовую рутину правок. Мы прошли этот путь в проекте по разработке учетной системы и нашли выход через внедрение архитектурного паттерна Page Object Model (POM).
Состояние «до» с линейными автотестами
Когда мы только начинали работу над учетной системой для одного из наших заказчиков, то писали автотесты в простом линейном формате – они представляли собой цепочки команд, полностью отражающих сценарии пользователей. На старте это позволило нам оперативно покрыть продукт тестами и получать быстрый фидбек по продукту. В приоритете была скорость.
Читать далееОдним из самых важных инструментов, который помогает организовать процесс разработки программного обеспечения, является «Спецификация на разработку», или СНР. Этот документ служит своего рода дорожной картой для всей команды, от аналитиков до разработчиков, и позволяет четко определить требования к продукту. Но что делать, когда на проекте работают десятки аналитиков и каждый пишет спецификацию «в свободной форме»? Ответ прост: использовать шаблоны.
Привет, Хабр! Меня зовут Анатолий Троян, я ведущий разработчик и технический архитектор IBS. В этой статье я хочу поделиться личным опытом применения шаблонов СНР на реальном проекте по разработке 1С-системы: как мы писали спецификации, какие у нас при этом возникали проблемы, почему вообще решили все стандартизировать и как отрабатывали изменения в документе.
Читать далееВ этой статье мы настроим проводную сетевую аутентификацию 802.1x в РЕД ОС 8 с использованием certmonger, cepces, nmcli и инфраструктурой Microsoft PKI и NPS. Инструкция применима и к другим RHEL-based дистрибутивам.
Предполагается, что инфраструктура PKI и 802.1x уже развернута для рабочих станций Windows, и наша цель добиться такого же результата для рабочих станций Linux.
Реализация состоит из двух частей:
- автоматизация запроса сертификата рабочей станции из Microsoft Certification Authority (CA)
- настройка Network Policy Server (NPS) и Network Manager для аутентификации Linux клиентов
Илон Маск — успешный предприниматель, известный инновациями в самых разных отраслях: от онлайн-платежей и транспорта до аэрокосмической отрасли и нейротехнологий.
Он развивает электромобили, создает мозговые импланты, разрабатывает многоразовые ракеты, а в перспективе планирует колонизировать Марс.
С чего начинался путь Маска и какие компании он развил, расскажем в этой статье.
Читать далееПоследние пару лет ИИ живёт жизнью, о которой большинство технологий могут только мечтать. Он не вошёл на рынок вежливо, как полезное обновление существующего программного обеспечения.
Он ворвался как шторм, который потребовал внимания, перестроил повестки дня залов заседаний, захватил бюджеты, переписал дорожные карты продуктов и заставил целые индустрии внезапно вести себя так, будто они опоздали на гонку, о старте которой даже не подозревали.
Если вы работаете в технологиях, вы, вероятно, это почувствовали. Это ощущение, что в каждом разговоре теперь сидит «ИИ», как неизбежный гость. Слайды квартальных бизнес-обзоров выглядят по-другому. Презентации для инвесторов выглядят по-другому. Описания вакансий выглядят по-другому.
Даже базовые инструменты, которые раньше казались завершёнными и стабильными, теперь поставляются с новыми кнопками, предлагающими «с поддержкой ИИ» то и «с помощью ИИ» это.
И всё же, под волнением, глянцевыми демо и постоянным потоком объявлений, более тихий и более некомфортный вопрос начал появляться чаще, чем люди признают.
Устойчиво ли это?
Читать далееПредставьте: вы работаете в крупной компании с федеральной сетью. У вас более 300 баз данных Microsoft SQL Server, сотни тысяч объектов — таблиц, процедур, функций, триггеров. Значительная часть бизнес-логики реализована с использованием cross-database references и распределённых запросов через linked servers, что создаёт сложные зависимости между объектами на разных базах и даже серверах.
А теперь представьте, что все изменения в схему вносятся напрямую в production — через SSMS, без версионирования, без ревью, без возможности отката.
Звучит как кошмар? Но именно так работала наша команда более 10 лет.
«Так исторически сложилось» — и это было нормой. Такой подход неизбежно порождал инциденты: от локальных нарушений целостности данных до масштабных простоев, напрямую влияющих на выручку и репутацию компании.
Мы поняли: нужно внедрять CI/CD. Но главная проблема оказалась не в технологиях — а в людях.
Читать далее2026 год в разгаре: мы пережили новогодние обновления фреймворков, свежие релизы ИИ-моделей и, возможно, первые эксперименты с AGI в labs. Но после праздничного кода и кофе пора нырнуть в фундаментальное — как сделать ИИ, который не просто генерирует текст, а эволюционирует в реальном времени. Около месяца назад Google Research анонсировали архитектуру HOPE с вложенным обучением для непрерывной памяти. А теперь — свежий пост о более ранних, но потенциально революционных работах: Titans и фреймворке MIROS. Это гибрид рекуррентных сетей и трансформеров, где память обновляется на лету через "сюрприз".
Читать далееЧто, если в этом году мы не просто вернемся к кодингу и дедлайнам, а задумаемся о чем-то по-настоящему фундаментальном? О сознании — своем и машинном. Ведь в мире, где ИИ уже пишет код лучше джунов-разработчиков, вопрос "Кто я?" становится не философским, а практическим. Сегодня разберем свежую работу Стивена Фитца — это целый инженерный план по созданию субъективного опыта в компьютере.
Читать далееВ завершение 2025 года хотелось бы взглянуть на наш проект российского BPM-движка “с высоты птичьего полета” и оценить, насколько нам удалось продвинуться по глобальной функциональной карте. Особенно в свете недавно вышедшего обзора ТБанк, где коллеги пришли к выводам о необходимости создания собственного форка и поставили много вопросов о том, что Camunda-ориентированная разработка архитектурно хороша, но не отвечает многим современным требованиям безопасности.
Читать далееПоказана численная близость -значений -теста, -теста и -критерия Манна-Уитни в А/Б-тестах вероятностям лучшей группы байесовских моделей. Соотношения выполняются несмотря на различия в определениях.
ЧитатьДля меня tmux - это не просто терминальный мультиплексор, это центр моей консоли: чтобы я не намеревался сделать - открытие новой панели будет моей стартовой точкой, особенно когда дело касается Kubernetes.
И вот однажды, в момент очередного использования kubectl config current-context появилась идея - "а не научить ли tmux показывать мой контекст?"
Так появился небольшой tmux-плагинчик, а так же сама эта статья, в которой я покажу и расскажу как это просто - написать плагин для tmux, надеюсь будет увлекательно.
Читать далееНейросеть Kling и ее обновление Motion Control взорвала интернет. Видео получаются как из профессиональной студии, а делаются за пять минут с телефона. Но есть проблема — оригинальный сайт Kling требует иностранную карту, VPN и танцы с бубном вокруг регистрации, которая то работает, то не работает, а промты на английском часто выдают совсем не то, что задумывал.
Для русскоязычных пользователей появилось решение попроще. Агрегатор StudyAi собрал Kling AI и другие нейросети в одном месте, добавил русский интерфейс, который понимает промты на родном языке без перевода, и сделал возможной оплату российскими картами. Никаких плясок с VPN, никаких проблем с доступом — просто заходишь и создаешь видео.
Сегодня вашему вниманию предлагается пятая серия - Тунис (с попутным охватом Ближнего Востока) и его житель, скрывающийся под позывным abou1234.
Читать далее