Feed aggregator

Hybrid RAG knowledge base за 15 минут — почему пришлось собрать свою lite версию RAG и в чем опасность RAG фреймворков

Habr.com - 1 hour 18 min ago

Архитектура Hybrid RAG систем заняла нишу корпоративных баз знаний, став стандартом для построения сервисов генерации контента на основе внутренних корпоративных данных. Уже пару лет у этого подхода практически нет альтернатив, когда речь заходит о сочетании возможностей генеративного ИИ с требованиями корпоративной безопасности и доверия к полученным результатам. Ключевое преимущество RAG перед обычным взаимодействием с нейросетями заключается в прозрачности: мы четко видим, на основе каких документов был сформирован ответ, и можем проверить каждый шаг пайплайна

Почти в каждом проекте, которые мне удалось наблюдать, происходило одно и то же - сначала команда стартует с LangChain или LlamaIndex через пару месяцев пайплайн становится неуправляемым, далее половина фреймворка выкидывается и пишется свой костомный retrieval. В итоге архитектура почти всегда выглядит одинаково - Frontend + Python backend + vector search + LLM API

В этой статье я покажу почему это происходит, поделюсь сложностями с которыми можно столкнуться при реализации корпоративных баз знаний основанных на RAG технологиях, расскажу почему готовые фреймворки иногда могут быть опасны для проекта и как я пришел к созданию универсальной сборки RAG системы разворачиваемой за 15 минут

За последние два года вокруг вокруг RAG систем сформировалась огромная инфраструктура. Появились специализированные фреймворки и облачные сервисы. Однако, если присмотреться к реальным запросам бизнеса, вырисовывается устойчивый паттерн. Компании хотят быстрый запуск без глубокого погружения в разработку продукта, в пару кликов загрузить корпоративные документы и получать ответы на запросы по своим внутренним документам. Компаниям не нужен очередной конструктор с бесконечными настройками, а востребована легкая, быстро разворачиваемая корпоративная RAG база знаний

Основной актив, с которым должны работать такие системы это регламенты, техническая документация, договоры, инструкции и неструктурированные базы знаний. И здесь RAG действительно незаменим. Но существует и обратная сторона медали:

Читать далее

Чебурнет 2026: как мы дотерпелись

Habr.com - 2 hours 14 min ago

Снова привет, Хабр.... добро пожаловать в 2026

О белых списках, Yggdrasil и о том как мы достигли нового уровня блокировок

Читать далее

Менеджер памяти CPython — проектируем с нуля, простым языком

Habr.com - 3 hours 57 min ago

Давайте спроектируем с нуля менеджер памяти CPython — начнём с самой простой и понятной наивной реализации, а затем шаг за шагом будем разбираться, какие изъяны в ней есть, и придумывать как их решать, постепенно усложняя общую модель.

Это один из лучших способов понять сложную систему — пройти путь её поэтапного проектирования. Система сложна, осознать её очень непросто, но мы разобьём её на простые шаги, понять которые очень легко. После этого пазл сам собой сложится в голове, и общая картина системы будет для вас такой же простой и очевидной.

Читать далее

ИИ будет писать код. Но кто возьмёт ответственность за жизнь программного обеспечения?

Habr.com - 4 hours 12 min ago

Впервые в истории человечество может генерировать программное обеспечение быстрее, чем способно понимать создаваемые системы.

На протяжении многих лет индустрию программного обеспечения волновал один вопрос:

Кто будет писать код?

Теперь искусственный интеллект способен генерировать тысячи строк кода за секунды.

Но это порождает гораздо более важный вопрос — тот, который почти никто в технологическом мире не задаёт:

Кто будет нести ответственность за жизнь программных систем, которые ИИ собирается создавать?

Потому что написать код легко.
Жить с последствиями этого кода следующие двадцать лет — значительно сложнее.

Чтобы понять, что на самом деле происходит, нужно разделить три совершенно разные роли в разработке программного обеспечения.

1️⃣ Написание кода
2️⃣ Проектирование алгоритмов и систем
3️⃣ Ответственность за жизненный цикл программного обеспечения

Эти роли часто воспринимаются так, будто это одно и то же.

Но это не так.

И появление ИИ заставляет нас наконец увидеть эту разницу.

Читать далее

Магия ИИ-банкинга 5.0 и её разоблачение

Habr.com - 4 hours 55 min ago

Никто не просыпается утром с мыслью: «Скорее бы открыть банковское приложение!» Серьёзно, никто не испытывает такого трепета, разве что вынуждено из-за необходимости проверить зарплату. И знаете что? Это нормально. Банк — это не Онлайн-кинотеатр и не Telegram. Но есть одна вещь, которую хочет каждый: чтобы банк помогал жить так, как ты хочешь. Не мешал, не заставлял заполнять анкету в пятый раз, а просто — помогал достигать целей! Возможно?

Читать далее

Теорема Гаусса‑Маркова и ее условия

Habr.com - 5 hours 23 min ago

Теорема Гаусса‑Маркова:

Почему метод наименьших квадратов работает? Почему ему можно доверять? И при каких условиях он действительно дает лучшие оценки?

В статье разбираю теорему Гаусса‑Маркова, ее условия и что делать, если реальность не идеальна, без сложной математики и больших формул

Читать далее

Хоткеи, которые я реально использую каждый день — справочник за 10 лет разработки

Habr.com - 5 hours 45 min ago

Мышечная память не ждёт ответа от API и работает без интернета. Собрал справочник шорткатов, которые реально прижились за 10 лет: WebStorm, Chrome, терминал, alt-коды для таблиц и файловых деревьев. Осознанно олдскульный формат — статья в закладки.

Читать далее

Почему людей корёжит от ИИ, даже когда текст нормальный

Habr.com - 5 hours 57 min ago

Дорогие любители написать, что текст ИИ-шный, эта статья также, как и все другие отредактирована ИИ.

Под моими статьями на Хабре в какой-то момент начал повторяться один и тот же сценарий. Не обсуждение тезисов, не спор по аргументам, не разбор примеров — а мгновенный заход в комментарии с диагнозом: «нейротекст», «нейрослоп», «научитесь формулировать мысли сами». Иногда человек даже не дочитывает материал до середины, но уже уверен, что проблема именно в инструменте, а не в содержании.

Меня это сначала раздражало, потом удивляло, а потом стало просто интересно. Потому что я не скрываю, что использую ИИ как редактор и помощника: чтобы быстрее шлифовать структуру, перепроверять формулировки, вытягивать из головы черновую мысль в более читаемый вид. Но я при этом не понимаю, где здесь логическая связка: если текст редактировался с помощью ИИ, почему это автоматически означает, что у автора нет своих мыслей?

В какой-то момент стало ясно, что спорить на уровне «ну это же просто инструмент» бесполезно. Если тема так многих цепляет, значит, за этим стоит что-то глубже: недоверие, культурная реакция, ощущение подмены, страх обесценивания труда — что угодно. Поэтому я решил не гадать и посмотреть, что на этот счёт вообще говорят исследования.

Читать далее

РСПКДС: мнемонический шаблон для  обработки данных в Dart -шпаргалка для начинающих

Habr.com - 6 hours 5 min ago

В статье разберём РСПКДС — простой мнемонический шаблон, который поможет новичкам в Dart структурировать базовые операции обработки данных. Покажу, как использовать формулу для решения типовых задач, приведу примеры кода и дам практические рекомендации. Вы узнаете, как за 6 шагов превратить сырые данные в осмысленный результат.

Читать далее

Как я построил VPN-сервис на VLESS+REALITY для 670 пользователей и что из этого вышло

Habr.com - 6 hours 6 min ago

TL;DR: Поднял VPN-инфраструктуру на VLESS+REALITY с нуля. Telegram-бот + мини-приложение, горячее управление пользователями через gRPC без рестартов XRay, балансировка между серверами, почасовой биллинг. В статье — полный разбор протокола, почему DPI его не видит, как устроена архитектура на 670+ юзеров, и все грабли, на которые я наступил в production.

Предыстория

Полгода назад я решил разобраться, как работают современные VPN-протоколы. Не на уровне «скачал WireGuard, поставил, работает», а глубже — как устроено шифрование, почему одни протоколы детектируются DPI, а другие нет, и можно ли собрать что-то своё.

Начал с OpenVPN. Потом WireGuard. Потом Shadowsocks. И каждый раз натыкался на одну и ту же проблему: DPI-системы провайдеров со временем учатся распознавать любой нестандартный трафик.

А потом я нашёл VLESS+REALITY. И понял, что это принципиально другой подход.

Соник, расскажи!

Новая норма ИТ-команд: недоговаривать

Habr.com - 7 hours 43 min ago

«Я заметил, что возникает дефицит внимания в твоей команде, и это снижает мотивацию,» — сказал председатель ПРП в одной из наших приватных бесед на профсоюзной встрече. И я решила разобраться с этим. В статье опишу результаты этого исследования: возникновение, основные проявления и способы устранения этого дефицита.

Читать полностью

Todo Budget v5.0: переписал весь UI с нуля на Jetpack Compose — и теперь ищу тех, кто его сломает

Habr.com - 7 hours 49 min ago

До пятой версии главный экран был функциональным, но визуально скучным. Типичный Material Design без характера. Я получил несколько честных отзывов — в том числе жёстких — и решил переделать всё.

Читать далее

Способы повышения надежности встраиваемого ПО

Habr.com - 7 hours 49 min ago

В этом тексте я бы хотел перечислить способы повышения надежности для встраиваемого ПО. Cуществует много приемов, которые помогают повысить надежность встраиваемого ПО.

Как прошивка может противостоять всяческим флуктуациям во время своей работы и обезопасить себя от зависания или повреждения исходных данных?

Читать далее

Кто зарабатывает на бирже на самом деле: инструменты, игроки и стратегии

Habr.com - 8 hours 2 min ago

Если ты уже полчаса сидишь за покерным столом и не можешь понять, кто тут лох - значит, лох это ты.

Приветствую читателей, с ростом популярности темы инвестиций и финансов на просторах интернета появились люди, которые не против нажиться на не знающих гражданах. В этой статье предлагаю разобраться, какие основные финансовые инструменты представлены на фондовом рынке, какие игроки есть на бирже, в какую игру стоит играть, а в какую нет и в каких ситуациях биржа приравнивается к казино.

Также разберем основные рабочие инвестиционные стратегии, подходящие новичкам.

Эта статья покрывает все необходимые знания, чтобы начать пользоваться финансовыми инструментами, дальше все зависит от вас и вашего желания развиваться.

Предлагаю начать с вещей, на основе которых вообще создавались финансовые инструменты, есть 4 показателя эффективности.

Ликвидность - насколько легко и быстро вы можете продать актив по желаемой цене.
Риск - вероятность потери капитала.
Доходность - какой доход можно получить.
Волатильность - как быстро и насколько сильно меняется цена актива.

Эти 4 показателя взаимозависимы и взаимообусловлены, финансовые инструменты имеют свойства заменять 1 показатель на другой. Например, квартиру сложно продать (низкая ликвидность), у квартиры низкий-средний риск, маленькая доходность, низкая волатильность. Вы можете обменять ее на фиатные деньги и они будут обладать другими свойствами: очень высокой ликвидностью (легко продать), низким риском, отрицательной доходностью (из-за инфляции) и низкой волатильностью (в зависимости от валюты).

Читать далее

Агрессивное поведение ускоряет старение

Habr.com - Fri, 03/06/2026 - 23:22

Подростковый возраст сам по себе сопровождается социальными конфликтами. Новое лонгитюдное исследование показало, что агрессия влечет физические последствия. Наблюдая за 121 человеком в возрасте от 13 до 30 лет, ученые обнаружили, что подростковая агрессия, а именно частые вспышки гнева по отношению к сверстникам или родителям – мощный фактор, предсказывающий ускоренное биологическое старение.

Читать далее

Геймеры, нам надо поговорить. Почему вы до сих пор не бросили использовать физические носители?

Habr.com - Fri, 03/06/2026 - 23:05

Этот текст вызовет много негатива, но нам и правда надо признаться самим себе. Цифровые сервисы победили давно и с большим отрывом. Особенно на рынке видеоигр.

С этим можно долго спорить, ругаться и говорить, что это не так, но вот вам факт: физические копии — это рудимент и атавизм, от которого пора отказаться, и в этом материале я постараюсь объективно объяснить почему.

Читать далее

Java для автотестов: первые шаги с нуля

Habr.com - Fri, 03/06/2026 - 22:22

Статья к открытому уроку курса QA Automation Engineer про начало разработки тестов на языке Java которая погружает в основы синтаксиса.

Читать далее

Открываю ленту, а там очередной апокалипсис — Anthropic говорит, что ИИ убивает джуниоров :-)

Habr.com - Fri, 03/06/2026 - 22:21

Anthropic и Стэнфорд доказали, что ИИ пожирает рабочие места молодых.

Медиа опять ликуют, все заголовки кричат, LinkedIn (и внезапно threads) рыдает, нууууу, надеюсь, чашка чая наготове - потому что мы сейчас будем опять разбираться, а правда ли это :)

спойлер: все не так однозначно

Меня зовут Эдгар Сипки, и я как обычно вещаю про современную it индустрию и бизнес в нем - кстати, подпишись ка на канальчик мой

Тезис статьи простой: исследование действительно серьёзное, но выводы - преждевременные опережающие реальность И (ИЛИ) не учитывают рынок в целом, а учитывают только один из текущих факторов.

Читать далее

Шарнир Гука: решаем задачу из Мещерского

Habr.com - Fri, 03/06/2026 - 21:57

Карданная передача, она же — шарнир Гука. По-английски этот агрегат называется universal joint.

В этой классической задаче интересна не только кинематика. Удивительно, но при постоянных значениях моментов и система может иметь до четырех различных положений равновесия.

То есть «очевидное» соображение в духе «если первый момент больше второго, то валы крутятся в одну сторону, а если наоборот — то в другую» здесь не работает.

Через обозначим центр крестовины и введем две системы координат и . Первая система связана с валом , а вторая -- с валом . Оси и проходят через перекладины крестовины и перпендикулярны друг другу:

Читать далее

[Перевод] Как юрфирма из 2 человек уделала корпорацию со 100 юристами с помощью подписки на ИИ за $20

Habr.com - Fri, 03/06/2026 - 21:40

Пятница, семь вечера. До закрытия многомиллионной сделки по слиянию остаются считанные часы, и тут юристы покупателя сбрасывают вам в почту бомбу.

В письме — контракт, вдоль и поперек исполосованный красными правками: новые условия эскроу, жесткие отказы от претензий и перекроенный график закрытия. Подтекст читается между строк: либо вы подписываете это к утру понедельника, либо сделка отменяется.

Если вы работаете в классической юридической конторе на Уолл-стрит или в Кремниевой долине, этот сценарий запускает болезненный, доведенный до автоматизма протокол. Седовласые партнеры бьют тревогу. Тройку-пятерку младших юристов отправляют на принудительную ночную вахту. Клиенту капают тысячи долларов в час, пока люди с воспаленными от недосыпа глазами вручную сверяют сотни страниц зубодробительного юридического текста.

Зак Шапиро, выпускник Йеля и экс-адвокат элитной фирмы Davis Polk & Wardwell, столкнулся именно с таким кошмаром. Но он не стал поднимать команду по тревоге. Не заваривал литры ночного кофе. И не выставлял клиенту счет за сорок часов панической суеты.

Вместо этого он загрузил документы в нейросеть Claude, отправил ей выверенный набор инструкций и спокойно пошел по своим делам. К одиннадцати вечера в ящике покупателя уже лежало железобетонное встречное предложение. На следующее утро сделка закрылась без единой заминки.

Манхэттенская фирма Шапиро Rains LLP, состоящая всего из двух человек, играючи жонглирует сложнейшими сделками с венчурным капиталом и M&A (слияния и поглощения), для которых традиционно требуется целая армия юристов. Его недавний тред в X (бывший Twitter) с разбором этого процесса произвел эффект разорвавшейся бомбы, собрав более 7 миллионов просмотров.

Читать далее

Who's online

There are currently 0 users and 0 guests online.
Syndicate content