В IT-сообществе только и разговоров об эмбеддингах, metric learning, косинусных расстояниях и семантическом поиске. На конференциях все хвастаются красивыми слайдами про нейросети и векторные пространства. Но если заглянуть под капот и посмотреть, что реально работает в поиске крупных маркетплейсов и e-commerce платформ, то там, как правило, он — добрый, старый полнотекстовый индекс.
Почему? Потому что полнотекстовый поиск — это стабильно, быстро и понятно. Минус только один, его уже недостаточно. Да, он классно ловит точные совпадения, но синонимы, переформулировки и небольшие ошибки прощает пользователям уже с большим трудом.
Меня зовут Игорь Самарин, я Machine Learning Engineer из команды поиска в Купере, где уже полтора года занимаюсь проектами, связанными с векторами. В этой статье я расскажу, как на самом деле работает поиск внутри компании, поведаю о полнотекстовом поиске — его сильных сторонах и недостатках. Затем объясню специфику векторного поиска и разберу, какие именно проблемы старого подхода он решает и продемонстрирую, как обучить векторную модель на своих данных, чтобы она понимала специфику каталога. А в конце вас ждут реальные результаты из A/B тестов и небольшой панч о перспективах.
Читать далееЭта статья дополняет предыдущую. Там мы зафиксировали проблемы. Здесь разберем, что именно мы сделали со стороны Amplicode, чтобы агент начал работать как опытный software engineer: опираясь на структуру проекта, детерминированные генераторы и понятные высокоуровневые операции.
Если коротко, в первой статье было несколько основных болей:
– LLM часто обучены на слегка устаревшем мире, и это вылезает в мелочах (и не только).
– Галлюцинации и нехватка контекста идут рука об руку: «кажется, в этой библиотеке должен быть такой метод» и пошло-поехало.
– Переизбыток контекста тоже зло: агент прочитал половину репозитория, потратил деньги, запутался, а потом еще и забыл начало чата.
– Типичный агентный workflow: «сгенерил простыню кода, оно не компилится, давай чинить, ой теперь сломалось другое».
И на этом фоне появляется логичный вопрос: а можно сделать так, чтобы агент работал не с сырыми файлами, а с моделью проекта и сущностями фреймворка? Чтобы он не гадал, где DTO, как принято именовать контроллеры и какие миграции у вас используются?
Собственно, Amplicode MCP про это.
Читать далееПривет, Хабр!
Меня зовут Елена Грицай, почти полгода я работаю тестировщиком в Fix Price IT. Хочу поделиться наблюдениями о том, как быстрее влиться в новый проект: поговорим и про процессы, и про личные качества, и про командную культуру.
Читать далееЗнакома ли вам ситуация, когда команда неделями спорит о дизайне решения, собирает тонны данных, проводит бесконечные исследования, собирает бесчисленное количество встреч? Запуск постоянно откладывается. Вместо быстрых экспериментов - совещания и пересчеты. Продукт практически не развивается, инновации остаются на бумаге.
Это не просто "data-driven", а уже аналитический паралич - болезнь современных data-driven компаний, когда стремление к 100% уверенности парализует саму возможность принимать решения.
Парадокс в том, что паралич возникает именно в тех командах, которые хотят делать всё правильно. Они изучали про data-driven подход, внедрили аналитику, наняли высококомпетентных специалистов. И утонули в данных.
Давайте разбираться, почему это происходит и как вернуть команде способность двигаться вперед.
Читать далееВ поисках практических решений по глубокой интеграции искусственного интеллекта в настольные операционные системы я обратился к опыту китайских разработчиков. В отличие от западного подхода, где ИИ остается преимущественно облачным сервисом или отдельным приложением, в Китае его внедряют непосредственно в дистрибутивы Linux, создавая целостную пользовательскую среду. Как вы относитесь к ИИ? Нужен ли он в операционных системах? Давайте попробуем разобраться и порассуждать.
Дальше всего в интеграции ИИ в Linux продвинулись разработчики дистрибутива deepin V23 (Deepin / UOS AI). В Deepin V23 встроен помощник “UOS AI”, есть поддержка естественноязыковых команд управления системой, более 40 сценариев использования, адаптация под множество приложений.
Важнейшая архитектурная особенность — гибкость на уровне модели. Система позволяет подключать как облачные большие языковые модели (LLM) через API, совместимый с форматом OpenAI, так и запускать локальные модели непосредственно на устройстве (on-device). Это стало возможным благодаря оптимизациям, выполненным совместно с Intel для эффективной работы на периферийных устройствах.
Основные компоненты и возможности
Grand Search (“大搜索” или “Intelligent Grand Search”)
«А че? Прямо сразу штраф 500к и дадут?», «В 168-ФЗ только про вывески, а не про сайты», «С чего вы взяли, что надо проверять?», «Инфа про запрет — громкое название и хайп». Что такое «запрет иностранных слов» на самом деле: со ссылками на законодательство.
Читать далееСегодня потребности бизнеса растут так стремительно, что решения для унифицированных коммуникаций (UC) просто не успевают за ними. Аплайнсы — выделенные «железки» под конкретную задачу — очевидно устарели: масштабировать их сложно, обновлять страшно, а добавление новых функций напоминает скорее тест на выносливость. Я Владимир Сергеев, руководитель практики UC и ПО для совместной работы в К2Тех. Регулярно я сталкиваюсь с тем, как очередной апдейт превращается в персональную головную боль для ИT-отдела.
Решением, которое буквально спасло UC-инфраструктуру, стал Kubernetes. Теперь вместо тяжелых проприетарных коробок — легкие микросервисы. Вместо многочасовых простоев — обновления за минуты. Вместо страха перед будущим — быстрая реакция на любые бизнес-задачи. И никакого даунтайма для всей компании.
Давайте погрузимся в детали этого перехода: от неповоротливых «кирпичей» к динамичным контейнерам. Разберемся, почему страдать от обновлений больше не нужно. И посмотрим, так ли все радужно на самом деле.
Читать далееИстория электромобилей насчитывает почти два века. За это время они переживали взлеты и падения. Электрокары становились популярными во время мировых энергетических кризисов, а с их окончанием интерес к ним угасал.
Современный этап развития электромобилей, начавшийся на рубеже XX-XXI веков, был обусловлен не только стремительным ростом цен на нефть, но и ухудшившейся экологической обстановкой. В 2009-2010 гг. на рынок были запущены первые серийные электромобили, благодаря которым начался рост популярности концепции электромобиля во всем мире.
Антонина Пашкова, маркетолог СИГМЫ, проанализировала ситуацию с электротранспортом в России и мире и выяснила, какие глобальные изменения ожидаются в этой сфере в ближайшие 10 лет.
Читать далееКаждый год объем корпоративных данных растет процентов на 30–40, а к 2028 году глобальная сфера данных, по прогнозам IDC, достигнет почти 400 зеттабайт. Проблема в том, что большинство этих данных нельзя просто выкинуть. Логи нужны для аудита, датасеты для переобучения моделей, архивы проектов для юридических требований. Хранить все это на горячих дисках в продакшене ну просто очень дорого. Держать в облаке, впрочем, тоже. Причем с каждым годом все дороже. И что же выбрать?
Читать далееДИСКЛЕЙМЕР: Это статья является ручным переводом оригинальной статьи с небольшими пояснениями. Поводом для перевода стало слишком частое использование unsafe кода в других статьях о C# на русском языке в том числе тут на хабре.
Читать далееДавайте разберем, как выглядит работа с MCP, на реальном примере из опыта моего дата-консалтинга. В этой статье теории не будет, только практика, много скриншотов и пара лайфхаков.
Читать далееПривет, Хабр. Меня зовут Екатерина Гражданкина, я аналитик-исследователь в Одноклассниках.
Ежемесячная аудитория ОК достигает 34 млн пользователей в России. Основная аудитория старше 35 лет, и значительную часть из них составляют пользователи старшего поколения. В связи с этим, команде ОК крайне важно развивать соцсеть таким образом, чтобы она была одинаково комфортной для пользователей всех возрастов, особенно для людей старшего поколения, так как зачастую именно им сложнее разбираться в нововведениях в продукте.
Читать далееКоманда Go for Devs подготовила перевод статьи о трёх языках, которые всё чаще оказываются в одном ряду, но на самом деле решают принципиально разные задачи: Go, Rust и Zig. Автор несколько месяцев изучал каждый из них и попытался понять, какие ценности стоят за их устройством. Go выбирает минимализм и корпоративную предсказуемость, Rust — безопасность и максимальную выразительность, Zig — радикальный контроль и отказ от ООП-мышления. Получился честный и местами провокационный разбор того, зачем нужны эти языки и кому из разработчиков они подходят.
Читать далееKubernetes-операторы давно стали привычным инструментом автоматизации и управления сложными системами. Однако на практике их поведение далеко не такое предсказуемое, как в примерах из документации. Небольшие отклонения в логике цикла согласования, обработке ошибок или обновлении статуса быстро превращаются в зацикливание, дублирование ресурсов и прочие сюрпризы, которые трудно отладить. Новичкам полезно понимать, почему так происходит, а опытным разработчикам — помнить, какие принципы стоит держать в голове при проектировании оператора.
Меня зовут Стас Иванкевич, я техлид в команде разработки управляющего слоя Platform V DropApp в СберТехе. В управляющий слой входят установщик кластера, консоль, API, другие компоненты и самое релевантное для этой статьи — наши многообразные операторы.
За последние несколько лет мы разработали целую пачку операторов — на один-два контроллера или сразу на множество. В ходе работы мы собрали и упорядочили лучшие практики, проверенные реальной эксплуатацией, а также подводные камни и типичные ошибки. И сегодня хотим поделиться нашей подборкой с вами.
Читать далее2025 год начался с новой волны дискуссий о влиянии искусственного интеллекта на рынок труда. Новостные ленты пестрят заголовками о сокращениях и заморозке найма, виновником которых называют ИИ. Однако эксперты Всемирного экономического форума в Давосе предлагают взглянуть на ситуацию под другим углом: несмотря на все успехи в автоматизации рутины, ИИ всё ещё не способен генерировать масштабные идеи, которые являются истинным двигателем экономики. Попытки автоматизировать процесс мышления великих умов лишь подчеркивают фундаментальные ограничения алгоритмов.
Читать далееСталкивались ли вы с болью при управлении порядком запуска и остановки зависимостей в вашем Go-сервисе?
Разработка больших сервисов неизбежно приводит к необходимости управлять множеством зависимостей. В этом контексте мы говорим о долгоживущих компонентах, чья работа обеспечивается отдельными горутинами: как правило, это блокирующий метод (например, Start), внутри которого крутится цикл обработки.
Примерный сценарий жизненного цикла сервиса выглядит так:
При запуске критически важно, чтобы пул соединений с БД, кэш и очереди были полностью готовы до того, как HTTP-сервер откроет порт и начнет принимать входящий трафик.
С graceful shutdown ситуация обратная: порядок должен быть строго зеркальным. Сначала нужно перестать принимать новые запросы, дождаться завершения текущих, остановить воркеры, и только потом разрывать соединения с инфраструктурой. Иначе мы получаем неприятные ошибки подключения и даже потерянные транзакции в момент деплоя.
Если эти проблемы вам не знакомы, смело закрывайте вкладку. Скорее всего, эта статья не принесет вам пользы.
Но если вы ищете способ автоматизировать эту рутину, сохранив код чистым - добро пожаловать под кат.
Читать далееВсем привет! На связи Angara Security. Сегодня Лариса Карпан, старший специалист по безопасной разработке, подготовила статью для AppSec- и DevSecOps-специалистов, а также для CISO, которые уже столкнулись с интеграцией ИИ в свои процессы и системы, но пока не знают, с какой стороны подойти к вопросам безопасности. Это, по сути, «MLSecOps для самых маленьких».
Просим опытных экспертов в области безопасности AI проходить мимо и не бросаться помидорами, статья рассчитана на новичков в данной области. Также хотим подчеркнуть, что данный материал относится ко всем типам ML-моделей, включая генеративный ИИ (GenAI) и предиктивный ИИ (PredAI).
Читать далееВсем привет! Меня зовут Артемий, я работаю SRE-инженером в команде RTP (real time processing) Clickstream в Авито. Сегодня мы хотим поделиться нашей историей о том, как мы переехали в Kubernetes, развернув Apache Flink с помощью Flink k8s operator.
Читать далееВсем привет!
Меня зовут Алексей Медведев. Первый раз я участвовал в кибербитве Standoff в 2022 году. Далее стал капитаном синей команды (Command and Defend, которая впоследствии сменила название на Ctrl+Alt+Defend) и возглавлял ее на протяжении пяти битв подряд. На Standoff 16 я передал эту ответственную должность и стал своеобразным наставником команды. Расскажу о том, как мы защищали и как нас ломали.
В этот раз, на октябрьском Stаndoff, наша команда защищала город. Эта довольно обширная инфраструктура, включающая в себя несколько сегментов, а также 14 уникальных критических событий (события, реализация которых приводит к нанесению значительного ущерба компании, далее — КС). Перед соревнованиями мы подготовили схему сети, на которой отметили все КС, а также отобразили сетевые взаимодействия между сегментами.
Читать далееПредыдущие части:
«Геометрическая головоломка на выходные»,
«Электродинамика виртуальной Вселенной»,
«Механика виртуальной Вселенной»,
«Квантовая механика виртуальной Вселенной (Часть I)»,
«Квантовая механика виртуальной Вселенной (Часть II)»
«Релятивизм виртуальной Вселенной»
Здравствуйте, дорогие читатели.
Предлагаю Вашему вниманию продолжение цикла статей о физике виртуальной Вселенной. Мы прошли длинный путь и смогли многое описать в рамках поля на сфере S3 с помощью модели Скирма, дополненной членом потенциала вакуума и расширенной на всё пространство. В самом начале, когда мы принимали гипотезу об общей замкнутости геометрии нашей виртуальной Вселенной и представили её в виде сферы S3 — мы приняли её радиус >= 1028 сантиметров, чтобы не конфликтовать с наблюдениями жителей этой самой виртуальной Вселенной о «плоскости» пространства. На тот момент, объяснение такого выбора было «заметено под ковёр», о чём я честно написал в заключении первой статьи. Кроме того я отметил, что к этому параметру нам ещё придётся вернуться. Это время пришло. Итак, давайте займёмся большим, в прямом и переносном смысле, делом — попробуем описать космологию нашей виртуальной Вселенной.
Дисклеймер: Эта глава в первую очередь адресована специалистам и тем, кто привык критически относиться к фундаментальным моделям, хотя, надеюсь, она будет интересна и более широкой аудитории.
Я не рассматриваю изложенную здесь модель как завершённую или окончательную теорию. Скорее, это попытка последовательно проверить, может ли единая фазовая SU(2)-структура дать связное описание известных физических масштабов — от микрофизики до космологии без введения дополнительных постулатов.
Читать далее