Квадратичная сложность и линейно растущий KV cache в классическом механизме внимания, используемом в современных LLM, — серьёзная преграда для обработки экстремально длинных контекстов, особенно в условиях ограниченной видеопамяти на GPU. В этой статье мы рассмотрим различные варианты Linear Attention (линейного внимания) и техники дистилляции LLM в субквадратичные варианты механизма внимания. Мы также расскажем о наших экспериментах с GigaChat и поделимся примером получившейся гибридной модели с линейным вниманием, сделанной на основе Llama-8B.
Читать далееКнига для фанатов автоспорта — с чертежами, историями и признаниями. Автобиография легендарного конструктора гоночных автомобилей, на которых становились чемпионами.
Эдриан Ньюи сейчас — управляющий технический партнер Aston Martin и акционер гоночного коллектива. Однако его путь — это уникальная хроника триумфов с командами, приведших к множеству чемпионских титулов. На протяжении своей инженерной карьеры он работал в Fittipaldi Automotive, March Engineering, Leyton House, Williams, McLaren и Red Bull Racing. О том, что сопровождало его на пути к славе, пожалуй, никто не расскажет лучше, чем он сам.
Читать далееСразу прошу прощения за огромный текст. Он немного неформальный, но я так хочу. Это лишь мое мнение, и я ни в чем никого не хочу убеждать.
Вообще, такую объемную статью не планировал. Но она, как снежный ком, всё разрасталась и разрасталась. Раньше я был ярым поклонником Гугла. Потом понял, что Гугл — это, конечно, хорошо, но, с учетом, как всё может повернуться, лучше переходить на сервисы своих — тех, кто точно не должен внезапно сказать, что у вас там в паспорте что‑то не то написано и деньги у вас плохие. Так я стал постепенно переходить на местный софт.
В первую очередь меня очень зацепила
Яндекс Музыка
На мой взгляд, это самый удачный проект Яндекса. Только ради него я стал покупать подписку и всё еще ей пользуюсь.
Мне очень нравится «концепция одной кнопки» для получения желаемого результата. Мне не хочется тратить время на выбор музыки — я просто хочу ее слушать. Изначально в сервисе был режим радио, либо просто поиск песен. Я всегда выбирал радио. Через время Яндекс поняли, что это оптимальный инструмент, он стал называться «Моя волна» и стал главной кнопкой. Зашел — включил — наслаждаешься. Сейчас у меня там 3500 лайков.
Опять же система оценок очень проста и понятна. Нет этих «5 из 10» или «3 из 5». Нравится — ставь лайк.
Благодаря этому сервису полюбил русские песни. Раньше меня почему‑то раздражали песни на русском. Как я заметил, не меня одного — знаю одно заведение, где строго запрещены песни на русском, и есть соответствующая настройка в приложении: русский, иностранный и еще «без слов». В свое время я предпочитал радио «Европа Плюс» — там всегда крутили то, что я люблю. Сейчас у меня пролайкано очень много разных исполнителей и, возможно, большая часть русские, хотя и старое не перестал любить.
Читать далееКоллектив ученых из МФТИ и НИИ системных исследований РАН разработал и успешно протестировал новый гибридный вычислительный метод для моделирования распространения сейсмических волн в геологических структурах со сложной, произвольно искривленной формой.
Читать далееПривет!
Меня зовут Катя Шадрина. 12+ лет в B2B‑продажах, руководила командами в Яндексе и Сбермаркете, продавала рекламу в 2ГИС, последние 2,5 года строю отделы продаж и обучаю сейлзов.
Помогла десяткам фаундеров и руководителей разобраться с наймом сейлзов и сформировать сильные команды, делюсь самым полезным и эффективным из моей практики.
Вижу как часто они недооценивают компетенции сейлзов на старте и сталкиваются с:
Читать далееНо я облажался...
Блин я даже в школе столько правил по русскому не читал, какой же наш язык сложный, а что бы реализовать все проверки, что бы правила корректно отрабатывали, проще застрелиться... Пришлось гуглить информацию по ЕГЭ 2025 года и ковыряться на НКРЯ. Много нового узнал =)
В общей сложности потратили неделю, на реализацию концепта, функционал, перенос правил русского языка.
Сцепка Родичкина: Концепция бестопливного удержания спутниковых группировок на сверхнизких орбитах (VLEO)
Читать далееКогда пришло время выбирать тему диплома, я, как и многие студенты, понятия не имел, о чём писать. После мозгового штурма с одногруппниками родилась идея, которая из простого «варианта для защиты» превратилась в полноценный инженерный проект: «исследование и разработка системы автоматического распознавания дефектов печатных плат».
Со временем я понял, что выбрал тему не случайно - это реально актуальная задача для производства, где качество пайки напрямую влияет на работоспособность устройств, а ещё отличный шанс пройти весь цикл Computer Vision проекта от сбора данных до обучения моделей.
Эта статья краткая выжимка моего опыта: как собрал собственный датасет дефектов печатных плат для обучения моделей, какие инструменты использовал и на что стоит обратить внимание.
Статья будет полезна:
Читать далееПредставим себе ненадолго нечто невозможное, что не подчиняется ни логике, ни законам природы. В одно ужасное мгновение, Солнце, наше светило, исчезло. Не взорвалось, не померкло, а просто перестало существовать. Мгновение назад оно кипело энергией, заливая светом и теплом нашу солнечную систему, и вот уже нет ни света, ни тепла, ни самой причины бега планет по своим орбитам. Что станет с людьми? Что станет с Землей, оставшейся в безмолвии и мраке межзвездной пустоты? Ответы — в той вечной ночи, которой не должно было быть.
Читать далееПредставители бизнеса часто спрашивают, какую информационную систему выбрать. И у меня нет ответа на этот вопрос, ведь все компании разные и, не понимая требований к информационной системе, рекомендовать ИТ‑решение нельзя.
Сразу хочу сказать, что выбор ИТ‑решения — это не техническая задача, а бизнес‑решение, и принимать его нужно не на основе данных в маркетинговых презентациях ИТ‑поставщиков, а на основе прозрачной методологии. В этом материале хочу рассказать о подходе к выбору ИТ‑решений. А уже использовать его или нет — решать вам.
К методологии выбораСегодня медицинские сервисы соревнуются за удобство: онлайн-запись, чат с врачом, результаты анализов в один клик.
Но есть одна особенность, которую часто недооценивают дизайнеры, продуктовые команды и разработчики:
Читать далееCryEngine2 использовал класс собственный CString для реализации работы со строками и немного использовал строки из стандартной строковой библиотеки Windows. Насколько я помню, последняя версия CryEngine всё ещё использует те же самые CString, она кардинально поменялась внутри, но как дань истории название класса менять не стали, зато сильно расширили функционал. Я не на 100% уверен, применялся ли CString только в редакторе или в рантайме игры тоже, вы можете сами это посмотреть в исходниках, которые все еще доступны на гитхабе. Это один подход к работе со строками, довольно распространенный в мире игростроя - когда мы все нужное пишем сами, не оглядываясь... хотя, тут больше уместно слово поглядывая, на существующие реализации и утаскивая в проект все самое лучшее.
Есть и другой подход... Я работал в команде над некоторым проектом, который должен был выйти на консолях, и в какой‑то момент на проект пришел эффективный тимлид, который хорошо умел в красивые презентации, и продавил использование std::string из sdk. Все очень опытные программисты, синьоры и руководство важно кивали на совещании и согласились всё перевести на std::string… не такие уж они оказались опытные, как выяснилось. В итоге мы заменили большую часть CString на std::string. Не сказал бы, что это сильно повлияло на время компиляции — плюс‑минус минута к проекту, который собирается двадцать минут, особой погоды не делают, но это также превратило наш довольно понятный базовый код в запутанный кошмар. Возможно, для переносимости это было лучше, но ни наш проект, ни CryEngine2 Editor так и не были портированы ни на Linux, ни на какую‑либо другую платформу.
Прошло десять лет, я вижу ровно туже ситуацию на текущем проекте — новый тимлид решил перевести местный MySuperPupeString на std::string, уже предчувствуя «нижней чуйкой» последствия — запасаюсь попкорном и беру отпуск на следующий месяц после принятия решения. Но не это интересно, а то — какие вообще строки могут быть в вашем с++ коде.
Что общего у массового применения конфигураций, встроенной поддержки OpenTelemetry и управления HA-кластерами в пару кликов? Всё это — части пазла, который мы собираем, чтобы сделать администрирование PostgreSQL по-настоящему удобным и безопасным. Выход версии Postgres Pro Enterprise Manager (PPEM) 2.3 стал важной вехой в развитии нашего графического интерфейса. Мы добавили поддержку пользовательских пресетов, переработали систему алертинга и усилили RBAC-модель управления доступом. Разбираем ключевые нововведения релиза, которые помогут навести порядок в зоопарке конфигураций и спать спокойно, зная, что система сама предупредит о проблемах.
Читать далееВсем привет! Меня зовут Яна Чеканова, я проджект-менеджер в red_mad_robot уже два года — и да, я не технарь, а филолог по образованию. Парадоксально, но именно это образование помогло мне в одном из самых технологичных проектов — создании AI-поиска для сервиса книги билайн.
Мы подключились, чтобы превратить идею умного поиска по книгам в технологию: векторизовали метаданные полумиллиона книг, обучили LLM и собрали гибридную систему, которая подбирает литературу по смыслу и контексту — даже если запрос звучит просто как «что-нибудь про путешествия во времени».
Рассказываю, как это было.
Читать далееСколько в Нови-Саде стоят аренда квартиры и продукты? Чем медлительность, ставшая национальной чертой сербов, нравится приезжим, а когда уже напрягает? Как узнать наших в толпе и при чём тут Россия 2010-х?
Слово Валентине, дизайнеру продукта Collabis, которая живёт в Нови-Саде больше двух с половиной лет.
Читать далееЧасто менеджеры и инженеры используют слова "процесс" и "система" как синонимы, не замечая фундаментального различия между ними. Когда говорят "система управления проектами" или "процесс разработки", кажется, что речь идет об одном и том же. Но это не так. Понимание того, что это разные сущности, может изменить ваш подход к организации работы, управлению и анализу любых явлений - от технических до организационных. В первую очередь этот эффект проявляется на коллективно деятельности. Даже если участниками коллектива являетесь только вы и вы.
Дело в том, что система и процесс - это две разные стороны одной медали. Давайте я открою вам мою секретную тайну? Система - это материальный, структурированный объект с определенным назначением. Процесс - это абстрактная последовательность действий и изменений, которые происходят во времени. И главное: процесс - это не отдельная сущность, а одно из описаний того, как система работает! Систему нужно рассматривать с разных сторон, и процессный взгляд – действительно, один из наиболее важных среди них.
Получить секретные знания из первых рукСтатей про Docker много не бывает.
В этом материале мы разберём базу: что такое Docker, как он работает и зачем нужен, а затем пошагово пройдём путь от установки до запуска первого контейнера.
Освоить рабочую базу Docker →Серия игр Silent Hill — это краеугольный камень жанра survival horror, который на протяжении десятилетий служил эталоном атмосферного и пугающего игрового опыта. У меня, как и у всех поклонников хоррора, эта серия навсегда в сердечке и, по моему мнению, одна из сильно повлиявших игр на хоррор-жанр в целом.
В этой статье я разобрал откуда серия берет свои корни, как и почему она эволюционировала из “японского взгляда на американские ужасы” в более традиционный японский ужастик. И почему Silent Hill f, на мой взгляд, вопреки распространенному мнению, все тот же Silent Hill.
Для начала разберем истоки серии, а именно первые части Silent Hill от оригинальной команды разработчиков Team Silent, чтобы разобраться каким же был тот самый оригинальный Silent Hill.
Читать далееВсем привет!
Я Senior Java Developer в банке, и за эти годы мне довелось пройти немало собеседований. Где-то было спокойно, где-то — как в допросной, с каверзными вопросами, странными задачами и вечным «а почему так, а не иначе?». В процессе я собрал целую коллекцию тем, которые всплывают снова и снова, особенно когда дело касается баз данных.
Сегодня хочу поделиться этим опытом и разобрать вопросы, которые чаще всего задают именно по SQL-базам.
Читать далееЯ семнадцатилетний студент СПО. У меня нет миллионов, команды или связей. Но у меня есть уверенность, что мы, как цивилизация, способны на большее. Мы ходим с айфонами, но живём в домах с кривыми дверьми, которые проектировали по лекалам полувековой давности. Я называю это "инженерным застоем". И я хочу его сломать.I
Читать далее