Привет! Это новый выпуск «Нейро-дайджеста» — коротких и полезных обзоров ключевых событий в мире искусственного интеллекта и технологий.
Неделя выдалась насыщенной: OpenAI провели «DevDay», Anthropic выкатили нового короля кодинга — Claude Sonnet 4.5. Релиз Sora 2 и Grok Imagine v0.9, не совсем безопасный ИИ-браузер Comet и Grokipedia от Илона Маска. Большая сделка OpenAI × AMD, нейро-лаборатория Дурова и школа, где учителей заменили на ИИ.
Всё самое важное — в одном месте. Поехали!
P. S. Если что, выпуск не спонсирован OpenAI, но они самые громкие на этой неделе!
Читать дайджест →Привет, Хабр! Меня зовут Алексей, и я тот самый программист, который до недавнего времени скептически относился к ИИ. «Очередная мода», — думал я. Но время не стоит на месте, и сейчас я активно изучаю ИИ как со стороны пользователя, так и с позиции разработчика.
Особенно интересной стала задача интеграции нашей внутренней системы управления задачами с ИИ. Типовое решение — использование векторной базы (RAG) в качестве промежуточного хранилища. Саму задачу я стал решать в режиме Vibe Coding (но об этом стоит написать отдельный пост).
С другой стороны весной команда Yandex DB анонсировала поддержку векторных операций, а на недавней конференции Yandex Neuro Scale упоминалось, что теперь YDB можно использовать в качестве RAG. Но вот незадача — я нигде не нашел end-to-end примера реализации. Пришлось разбираться самостоятельно.
Подробности под катомПривет, Хабр!
В этой статье речь пойдет об интересной задаче на одном из моих проектов. Он был разработан на React для документооборота сотрудниками. Так уж вышло, что со времен старта проекта основным текстовым WYSIWYG-редактором был небезызвестный Jodit. За долгие годы было написано много кастомных плагинов, например, для работы с упоминаниями сотрудников, и нас устраивала его надежность, хоть его внешний вид был далек от идеала.
И вот однажды заказчик пришел с запросом:
Читать далееВ этом уроке мы делаем нашего бота умнее и организованнее. Сначала наводим порядок в коде: разбираемся, что такое Роутеры, и выносим всю логику в отдельные файлы, как это делают профессионалы. Затем учим бота реагировать не только на текст, но и на фото и стикеры, используя мощные фильтры aiogram.
Читать далееПротокол Model Context Protocol (MCP) стремительно развивается, и вопросы его безопасности становятся всё актуальнее. Чтобы упростить реализацию защиты MCP-серверов в проектах на Spring AI, был запущен инкубационный проект spring-ai-community/mcp-security. В новом переводе от команды Spring АйО рассмотрим, как защитить MCP-сервер с помощью OAuth2 или API-ключей, а также как развернуть собственный MCP-совместимый Spring Authorization Server.
Читать далееПривет! Вообще у меня свой бизнес есть, а программирую я так, для души.
Нет, серьезно, я не умею программировать, но всегда хотел запустить свой IT-продукт.
Стать настоящим стартапером, как ребята из Кремниевой Долины. Сделать сервис, которым будут пользоваться люди, и за который они будут платить. И чтобы все само работало, без этих вот отделов продаж, встреч, договоров, актов и прочего.
И вот в последнее время я все чаще видел истории в интернете, как люди в одиночку запускали свои сервисы с помощью нейронок. Говоришь бездушной машине, что делать, она пишет код, он чудесным образом работает — продукт готов.
Решил попробовать тоже.
Увидел, как кто-то в Телеграме опубликовал пост с мемасом внутри поста, собранным из эмодзи.
Читать далееПривет!
Я Таня, фронтенд-разработчик в KTS и студент магистратуры МГТУ им. Баумана. На одном из недавних проектов я работала над интересной фичей — визуальным представлением аудиоданных, a.k.a. звуковой спектрограммой. Казалось бы, штука нехитрая: кто не видел график, прыгающий в такт с музыкой на разных частотах? Он есть в любом секвенсоре, на любом диджейском пульте и даже в динамическом островке последних айфонов.
Однако задача оказалась нетривиальной, поскольку для целей проекта мне нужно было разработать звуковую спектрограмму на React и MobX в особом дизайне. Подробных разборов этой темы и готовых решений я не нашла, поэтому в процессе пришлось самостоятельно разобраться с кучей тонкостей и нюансов. Результат можете посмотреть по ссылке.
А в этой статье я расскажу, как сделать такую же звуковую спектрограмму, а также как изменять ее стиль и другие параметры.
Читать далееСемейство методов Rank Fusion включает различные алгоритмы объединения нескольких ранжированных списков результатов в один улучшенный ранжированный список с целью повышения качества и надежности итогового ранжирования.
Основная идея — агрегировать информацию из разных систем или моделей, которые могут по-разному оценивать релевантность документов.
Rank Fusion широко применяется в информационном поиске, мультимедийном поиске, гибридных системах поиска, системах на основе модели Retrieval Augmented Generation (RAG), а также в задачах ансамблевого обучения.
В статье описан новый алгоритм семейства Rank Fusion, а может и не новый, дайте знать.
Читать далееПриветствую всех читателей! Меня зовут Игорь Конев и я техлид команды STaaS (Storage As A Service) в Авито. Сегодня я хотел бы в очередной раз поднять тему оценки задач, а конкретно оценки при помощи Story Points. Хотя мы давно применяем их в работе, оказалось, что команда по-разному трактует детали. Поэтому мы решили систематизировать и выровнять наши знания. Результатом работы стал этот материал, которым я с радостью делюсь с вами. Он не претендует на откровения, но удобно собирает терминологию, практические советы и наш опыт — возможно, это сэкономит вам пару-тройку Story Points.
Читать далееЯ устал вести таблички с серверами и сделал сервис, который теперь помогает другим.
В последние 8 лет я работал над множеством IT проектов и стартапов: от телеграм ботов, до высоконагруженных Web-сервисов. От ТЗ до MVP — в роли разработчика, тимлида, и даже продакта. И для всех этих проектов нужна была инфраструктура, которую, как правило, выбирал и поддерживал я в одиночку.
В один прекрасный момент, когда проектов стало много, «поиск сервера» неожиданно превратился в отдельную работу: у каждого провайдера свой кабинет и свои правила списаний, дизайн и логика панелей разные, тарифы меняются чаще, чем успеваешь привыкнуть. Сначала я решил парсить все тарифы в одну таблицу, чтобы быстро сравнивать цены и характеристики, а потом внезапно оказалось, что эта «самоделка» нужна не только мне. Так из простой таблицы выросла идея сервиса.
Читать далееAI прямо сейчас наступает на пятки разработчикам. У кого-то это вызывает иронию, кому-то помогает писать код. Но как ни крути, LLM создали прецедент, который громко заявил о себе и продолжает широко шагать по миру, сотрясая заголовки новостей и видео.
Меня зовут Рустам Курамшин, я работаю в IT более 10 лет, и мне как бэкенд-разработчику феномен LLM сначала казался больше игрой, чем реальным инструментом разработки. Все изменилось, когда я вырвался из проектов, предоставляющих опосредованный доступ к сервисам известных языковых моделей, и начал пользоваться официальными сервисами. Последние пару лет я активно использую ChatGPT для обучения, разработки и просто чтобы пообщаться о жизни.
А еще LLM помогает мне и моей хакатонной команде Java Boys уверенно побеждать на хакатонах. Опытом нужно делиться, так что ловите историю одной из наших побед. Расскажу, как мы с моими тиммейтами разработали AI-агента на Spring AI и API ChatGPT и выиграли полмиллиона на хакатоне МТС True Tech Hack 2025.
Читать далееКартинка: Youtube-канал xofunkox-scientific experiments, douglas-self.com
В технике инженеры бьются над созданием разнообразных преобразователей напряжения, содержащих множество деталей, но приходило ли вам голову, что сотни тысяч вольт могут быть «раздобыты» вообще почти без оных — с помощью всего лишь одной струи пара? И даже, честно говоря, вообще без ничего — только из струи воздуха? :-D
В прошлом мы уже рассматривали один очень интересный генератор электричества «из ничего», а именно — попросту из воды, и сегодня мы рассмотрим ещё один забытый вариант генерации сверхвысоких напряжений «из ничего», который, впрочем, уже наделал шуму — и речь пойдёт сегодня об эффекте Армстронга.
Читать далееСтандартное форматирование анкет маркетингового исследования — это не просто вопрос эстетики или формальности, а ключевой элемент обеспечения качества, достоверности и сопоставимости получаемых данных. Для менеджера, отвечающего за сбор и интерпретацию рыночной информации, знание и применение единых стандартов оформления анкет критически важно по следующим причинам:
Единообразная структура вопросов, логическая последовательность блоков и чёткая формулировка и единообразное форматирование инструкций снижают вероятность недопонимания интервьюерами и программистами. Это минимизирует ошибки при создании скрипта, заполнении анкеты и повышает точность собранных данных.
Нестандартные формулировки, двусмысленные вопросы или хаотичная структура анкеты могут привести к неявным искажениям в собранных данных.
Стандартное форматирование включает проверенные методики построения шкал, формулировок и логики переходов, что снижает когнитивную нагрузку на разработчика, интервьюера и уменьшает время разработки и тестирования анкеты перед началом поля.
Применяя стандарт менеджер не тратит время на "изобретение велосипеда" для каждого нового опроса. Он использует готовый, утвержденный шаблон. Это ускоряет создание анкеты в разы, снижает количество правок и время на их согласование будет потрачено на полевой этап и более качественный анализ результатов.
Данные с чистой, стандартизированной анкеты прописаны в задачах анализа в упорядоченном виде. Аналитику не приходится тратить 80% времени на "очистку" данных, исправление ошибок кодировки и приведение переменных к единому виду и поиску, какой именно вопрос имел ввиду менеджер фразой "Имиджевые высказывания в разрезе на возраст". Аналитик сразу приступает к анализу Q3s с банером Age.
Узнать стандарты оформленияКогда-то я даже нарисовал в Photoshop первое приложение Nebo — буквально нарисовал, по слоям, как открытку. А потом показал это программистам и увидел в их глазах то самое выражение: “он что, серьёзно?”
Читать далееКогда дедлайны дышат в спину, а компании нужно локализовать сотни обучающих видеороликов, то есть два варианта:
1. Уйти в дауншифтинг и завести ламу
2. Взять под контроль хаос мультиязычных видео, автоматизировать распознавание речи, оптимизировать процесс локализации и внедрить нейроозвучку
Ну, собственно, мы выбрали второй вариант) Собственно, в статье мы расскажем про наш пайплайн локализации видео, с какими граблями столкнулись и почему теперь фразы в духе «А давайте добавим еще один язык?» нас уже не так уж и пугают.
Читать далееВ этой статье я расскажу про данные Whatsapp и Telegram для ML-моделей: какие данные доступны, насколько они ценны и насколько легальны.
Читать далееПривет, Хабр! На связи Андрей Шведов, руководитель проектов в ГРАН Груп.
Мы производим печатные платы — основу любой электроники. Производство плат — сложный и комплексный процесс, который включает себя разные виды процессов: как мокрые, так и механические, как ручные операции, так и автоматизированные. И, хоть мы постоянно контролируем этапы производства, застраховать себя от возможных отклонений на 100% невозможно. Поэтому в единичных случаях что-то может пойти не так — печатная плата может иметь отклонения.
В этот момент не стоит паниковать, такое действительно может случиться. На этот случай у нас есть план Б. Когда заказчик приходит к нам с проблемой, мы начинаем исследовать ее по методике 8D: за восемь последовательных шагов мы находим причину, устраняем её и делаем так, чтобы эта проблема не повторилась.
В этой статье покажем пошаговую стратегию, позволяющую выявить и устранить коренные причины отклонений, извлечь уроки из ошибок и организовать быструю замену печатных плат.
Читать далееКак потратить почти полмиллиона долларов, чтобы собрать в центре Сан-Франциско хранилище данных объёмом 30 петабайт
Мы собрали в центре Сан-Франциско центр для хранения данных с общим дисковым пространством, где хранятся видеоданные общей длительностью 90 миллионов часов. Зачем? Мы предобучаем модели, чтобы разобраться с использованием компьютеров. Дело в том, что видео гораздо крупнее, чем текстовые данные. Например, на обучение такой текстовой БЯМ как LLaMa-405B требуется ~60 ТБ текстовых данных, а на хранение видео нужно в 500 раз больше текстового пространства. За хранение всей этой информации на серверах AWS пришлось бы выложить 12 миллионов долларов в год, поэтому мы пошли другим путём и арендовали пространство в колокационном центре в Сан-Франциско. Так нам удалось снизить эти расходы примерно в 40 раз (до $354 тысяч в год, считая издержки на устаревание).
Читать далееВ жизненном цикле разработки код — это лишь заполненные клеточки кроссворда. Самое интересное — в размышлениях: изучение предметной области, уточнение требований, продумывание архитектуры, поиск компромиссов, поэтапное тестирование и отладка.
Если коротко, процесс выглядит примерно так: сначала думаем — потом пишем. Но с приходом ИИ-кодинга всё изменилось.
Читать далееВ ноябре 2024 года я написал пост «Действительно ли Python такой медленный?», в котором протестировал множество версий Python и отметил стабильный прогресс производительности языка.
Сегодня девятое октября 2025 года, прошла всего пара дней после официального релиза Python 3.14. Давайте снова запустим бенчмарки, чтобы проверить, насколько быстра новая версия Python!
Примечание: если вам неинтересны таблицы и графики и вы хотите просто прочитать мои выводы, сразу переходите к концу статьи.
Читать далее