Архитектура Hybrid RAG систем заняла нишу корпоративных баз знаний, став стандартом для построения сервисов генерации контента на основе внутренних корпоративных данных. Уже пару лет у этого подхода практически нет альтернатив, когда речь заходит о сочетании возможностей генеративного ИИ с требованиями корпоративной безопасности и доверия к полученным результатам. Ключевое преимущество RAG перед обычным взаимодействием с нейросетями заключается в прозрачности: мы четко видим, на основе каких документов был сформирован ответ, и можем проверить каждый шаг пайплайна
Почти в каждом проекте, которые мне удалось наблюдать, происходило одно и то же - сначала команда стартует с LangChain или LlamaIndex через пару месяцев пайплайн становится неуправляемым, далее половина фреймворка выкидывается и пишется свой костомный retrieval. В итоге архитектура почти всегда выглядит одинаково - Frontend + Python backend + vector search + LLM API
В этой статье я покажу почему это происходит, поделюсь сложностями с которыми можно столкнуться при реализации корпоративных баз знаний основанных на RAG технологиях, расскажу почему готовые фреймворки иногда могут быть опасны для проекта и как я пришел к созданию универсальной сборки RAG системы разворачиваемой за 15 минут
За последние два года вокруг вокруг RAG систем сформировалась огромная инфраструктура. Появились специализированные фреймворки и облачные сервисы. Однако, если присмотреться к реальным запросам бизнеса, вырисовывается устойчивый паттерн. Компании хотят быстрый запуск без глубокого погружения в разработку продукта, в пару кликов загрузить корпоративные документы и получать ответы на запросы по своим внутренним документам. Компаниям не нужен очередной конструктор с бесконечными настройками, а востребована легкая, быстро разворачиваемая корпоративная RAG база знаний
Основной актив, с которым должны работать такие системы это регламенты, техническая документация, договоры, инструкции и неструктурированные базы знаний. И здесь RAG действительно незаменим. Но существует и обратная сторона медали:
Читать далееСнова привет, Хабр.... добро пожаловать в 2026
О белых списках, Yggdrasil и о том как мы достигли нового уровня блокировок
Читать далееДавайте спроектируем с нуля менеджер памяти CPython — начнём с самой простой и понятной наивной реализации, а затем шаг за шагом будем разбираться, какие изъяны в ней есть, и придумывать как их решать, постепенно усложняя общую модель.
Это один из лучших способов понять сложную систему — пройти путь её поэтапного проектирования. Система сложна, осознать её очень непросто, но мы разобьём её на простые шаги, понять которые очень легко. После этого пазл сам собой сложится в голове, и общая картина системы будет для вас такой же простой и очевидной.
Читать далееВпервые в истории человечество может генерировать программное обеспечение быстрее, чем способно понимать создаваемые системы.
На протяжении многих лет индустрию программного обеспечения волновал один вопрос:
Кто будет писать код?
Теперь искусственный интеллект способен генерировать тысячи строк кода за секунды.
Но это порождает гораздо более важный вопрос — тот, который почти никто в технологическом мире не задаёт:
Кто будет нести ответственность за жизнь программных систем, которые ИИ собирается создавать?
Потому что написать код легко.
Жить с последствиями этого кода следующие двадцать лет — значительно сложнее.
Чтобы понять, что на самом деле происходит, нужно разделить три совершенно разные роли в разработке программного обеспечения.
1️⃣ Написание кода
2️⃣ Проектирование алгоритмов и систем
3️⃣ Ответственность за жизненный цикл программного обеспечения
Эти роли часто воспринимаются так, будто это одно и то же.
Но это не так.
И появление ИИ заставляет нас наконец увидеть эту разницу.
Читать далееБанковское приложение на твоём телефоне знает о тебе больше, чем твой лучший друг. Каждую покупку, каждый перевод, каждую зарплату, каждый кредит. При этом тебя просят представиться и рассказать всю историю, когда ты звонишь в поддержку. Люди редко заходят в приложение банка ради удовольствия — это не Онлайн-кинотеатр и не Telegram. С другой стороны, каждый хочет, чтобы банк помогал тратить деньги с умом и достигать поставленных целей, подсказывал лучшие условия кэшбэка, напоминал о платежах и не забывал помогать инвестировать свободные деньги. Не заставлял заполнять анкету в пятый раз, а делал жизнь проще и выгоднее.
Читать далееТеорема Гаусса‑Маркова:
Почему метод наименьших квадратов работает? Почему ему можно доверять? И при каких условиях он действительно дает лучшие оценки?
В статье разбираю теорему Гаусса‑Маркова, ее условия и что делать, если реальность не идеальна, без сложной математики и больших формул
Читать далееМышечная память не ждёт ответа от API и работает без интернета. Собрал справочник шорткатов, которые реально прижились за 10 лет: WebStorm, Chrome, терминал, alt-коды для таблиц и файловых деревьев. Осознанно олдскульный формат — статья в закладки.
Читать далееДорогие любители написать, что текст ИИ-шный, эта статья также, как и все другие отредактирована ИИ.
Под моими статьями на Хабре в какой-то момент начал повторяться один и тот же сценарий. Не обсуждение тезисов, не спор по аргументам, не разбор примеров — а мгновенный заход в комментарии с диагнозом: «нейротекст», «нейрослоп», «научитесь формулировать мысли сами». Иногда человек даже не дочитывает материал до середины, но уже уверен, что проблема именно в инструменте, а не в содержании.
Меня это сначала раздражало, потом удивляло, а потом стало просто интересно. Потому что я не скрываю, что использую ИИ как редактор и помощника: чтобы быстрее шлифовать структуру, перепроверять формулировки, вытягивать из головы черновую мысль в более читаемый вид. Но я при этом не понимаю, где здесь логическая связка: если текст редактировался с помощью ИИ, почему это автоматически означает, что у автора нет своих мыслей?
В какой-то момент стало ясно, что спорить на уровне «ну это же просто инструмент» бесполезно. Если тема так многих цепляет, значит, за этим стоит что-то глубже: недоверие, культурная реакция, ощущение подмены, страх обесценивания труда — что угодно. Поэтому я решил не гадать и посмотреть, что на этот счёт вообще говорят исследования.
Читать далееВ статье разберём РСПКДС — простой мнемонический шаблон, который поможет новичкам в Dart структурировать базовые операции обработки данных. Покажу, как использовать формулу для решения типовых задач, приведу примеры кода и дам практические рекомендации. Вы узнаете, как за 6 шагов превратить сырые данные в осмысленный результат.
Читать далееTL;DR: Поднял VPN-инфраструктуру на VLESS+REALITY с нуля. Telegram-бот + мини-приложение, горячее управление пользователями через gRPC без рестартов XRay, балансировка между серверами, почасовой биллинг. В статье — полный разбор протокола, почему DPI его не видит, как устроена архитектура на 670+ юзеров, и все грабли, на которые я наступил в production.
Предыстория
Полгода назад я решил разобраться, как работают современные VPN-протоколы. Не на уровне «скачал WireGuard, поставил, работает», а глубже — как устроено шифрование, почему одни протоколы детектируются DPI, а другие нет, и можно ли собрать что-то своё.
Начал с OpenVPN. Потом WireGuard. Потом Shadowsocks. И каждый раз натыкался на одну и ту же проблему: DPI-системы провайдеров со временем учатся распознавать любой нестандартный трафик.
А потом я нашёл VLESS+REALITY. И понял, что это принципиально другой подход.
Соник, расскажи!«Я заметил, что возникает дефицит внимания в твоей команде, и это снижает мотивацию,» — сказал председатель ПРП в одной из наших приватных бесед на профсоюзной встрече. И я решила разобраться с этим. В статье опишу результаты этого исследования: возникновение, основные проявления и способы устранения этого дефицита.
Читать полностьюДо пятой версии главный экран был функциональным, но визуально скучным. Типичный Material Design без характера. Я получил несколько честных отзывов — в том числе жёстких — и решил переделать всё.
Читать далееВ этом тексте я бы хотел перечислить способы повышения надежности для встраиваемого ПО. Cуществует много приемов, которые помогают повысить надежность встраиваемого ПО.
Как прошивка может противостоять всяческим флуктуациям во время своей работы и обезопасить себя от зависания или повреждения исходных данных?
Если ты уже полчаса сидишь за покерным столом и не можешь понять, кто тут лох - значит, лох это ты.
Приветствую читателей, с ростом популярности темы инвестиций и финансов на просторах интернета появились люди, которые не против нажиться на не знающих гражданах. В этой статье предлагаю разобраться, какие основные финансовые инструменты представлены на фондовом рынке, какие игроки есть на бирже, в какую игру стоит играть, а в какую нет и в каких ситуациях биржа приравнивается к казино.
Также разберем основные рабочие инвестиционные стратегии, подходящие новичкам.
Эта статья покрывает все необходимые знания, чтобы начать пользоваться финансовыми инструментами, дальше все зависит от вас и вашего желания развиваться.
Предлагаю начать с вещей, на основе которых вообще создавались финансовые инструменты, есть 4 показателя эффективности.
Ликвидность - насколько легко и быстро вы можете продать актив по желаемой цене.
Риск - вероятность потери капитала.
Доходность - какой доход можно получить.
Волатильность - как быстро и насколько сильно меняется цена актива.
Эти 4 показателя взаимозависимы и взаимообусловлены, финансовые инструменты имеют свойства заменять 1 показатель на другой. Например, квартиру сложно продать (низкая ликвидность), у квартиры низкий-средний риск, маленькая доходность, низкая волатильность. Вы можете обменять ее на фиатные деньги и они будут обладать другими свойствами: очень высокой ликвидностью (легко продать), низким риском, отрицательной доходностью (из-за инфляции) и низкой волатильностью (в зависимости от валюты).
Читать далееПодростковый возраст сам по себе сопровождается социальными конфликтами. Новое лонгитюдное исследование показало, что агрессия влечет физические последствия. Наблюдая за 121 человеком в возрасте от 13 до 30 лет, ученые обнаружили, что подростковая агрессия, а именно частые вспышки гнева по отношению к сверстникам или родителям – мощный фактор, предсказывающий ускоренное биологическое старение.
Читать далееЭтот текст вызовет много негатива, но нам и правда надо признаться самим себе. Цифровые сервисы победили давно и с большим отрывом. Особенно на рынке видеоигр.
С этим можно долго спорить, ругаться и говорить, что это не так, но вот вам факт: физические копии — это рудимент и атавизм, от которого пора отказаться, и в этом материале я постараюсь объективно объяснить почему.
Статья к открытому уроку курса QA Automation Engineer про начало разработки тестов на языке Java которая погружает в основы синтаксиса.
Читать далееAnthropic и Стэнфорд доказали, что ИИ пожирает рабочие места молодых.
Медиа опять ликуют, все заголовки кричат, LinkedIn (и внезапно threads) рыдает, нууууу, надеюсь, чашка чая наготове - потому что мы сейчас будем опять разбираться, а правда ли это :)
спойлер: все не так однозначно
Меня зовут Эдгар Сипки, и я как обычно вещаю про современную it индустрию и бизнес в нем - кстати, подпишись ка на канальчик мой
Тезис статьи простой: исследование действительно серьёзное, но выводы - преждевременные опережающие реальность И (ИЛИ) не учитывают рынок в целом, а учитывают только один из текущих факторов.
Читать далееКарданная передача, она же — шарнир Гука. По-английски этот агрегат называется universal joint.
В этой классической задаче интересна не только кинематика. Удивительно, но при постоянных значениях моментов и система может иметь до четырех различных положений равновесия.
То есть «очевидное» соображение в духе «если первый момент больше второго, то валы крутятся в одну сторону, а если наоборот — то в другую» здесь не работает.
Через обозначим центр крестовины и введем две системы координат и . Первая система связана с валом , а вторая -- с валом . Оси и проходят через перекладины крестовины и перпендикулярны друг другу:
Читать далееПятница, семь вечера. До закрытия многомиллионной сделки по слиянию остаются считанные часы, и тут юристы покупателя сбрасывают вам в почту бомбу.
В письме — контракт, вдоль и поперек исполосованный красными правками: новые условия эскроу, жесткие отказы от претензий и перекроенный график закрытия. Подтекст читается между строк: либо вы подписываете это к утру понедельника, либо сделка отменяется.
Если вы работаете в классической юридической конторе на Уолл-стрит или в Кремниевой долине, этот сценарий запускает болезненный, доведенный до автоматизма протокол. Седовласые партнеры бьют тревогу. Тройку-пятерку младших юристов отправляют на принудительную ночную вахту. Клиенту капают тысячи долларов в час, пока люди с воспаленными от недосыпа глазами вручную сверяют сотни страниц зубодробительного юридического текста.
Зак Шапиро, выпускник Йеля и экс-адвокат элитной фирмы Davis Polk & Wardwell, столкнулся именно с таким кошмаром. Но он не стал поднимать команду по тревоге. Не заваривал литры ночного кофе. И не выставлял клиенту счет за сорок часов панической суеты.
Вместо этого он загрузил документы в нейросеть Claude, отправил ей выверенный набор инструкций и спокойно пошел по своим делам. К одиннадцати вечера в ящике покупателя уже лежало железобетонное встречное предложение. На следующее утро сделка закрылась без единой заминки.
Манхэттенская фирма Шапиро Rains LLP, состоящая всего из двух человек, играючи жонглирует сложнейшими сделками с венчурным капиталом и M&A (слияния и поглощения), для которых традиционно требуется целая армия юристов. Его недавний тред в X (бывший Twitter) с разбором этого процесса произвел эффект разорвавшейся бомбы, собрав более 7 миллионов просмотров.
Читать далее