Вопрос генерации со своим голосом занимал меня с v3.5. Другая интересная тема — аранжировка. Если не в обычном виде (на входе стиль и аккорды, на выходе “минус”), то способом обновления, “раскраски” черновика (mp3 из GM MIDI, Audio Upload, режим Cover). За пару лет я сделал много тестов, результаты представлял на Хабре, своём сайте, в Телеграм-канале. Последнее обновление Suno — повод снова вернуться к этим вопросам.
Свой голос
Как только версия 5.5 стала доступна, приступил к тестам опции “Your Voice” 1), опираясь на опыт с Suno v3.5 и RVC. Собрал 11 DS (голосовых наборов) на своём материале. Задача — проверить, как реагирует система на разный исходный материал, стили и параметры генерации.
1) Ссылка на процедуру “Your Voice” (PDF на русском) из раздела Help на сайте Suno.
Уже не раз касался понятий тембр и манера с психоакустической точки зрения. Нынче повод вернуться к теме: можно говорить похоже или нет, но чтобы контролировать, надо понимать механику.
Для синтеза вокала Suno (или другому ИИ) нужно обеспечить 3 компонента:
Тембр, или «окраска» звука, зависит от “геометрии” голосового аппарата: трахея, гортань, связки, резонаторы.(Певцы, артисты могут в определённой степени его менять. У родственников голоса часто похожи — физиология).
Интонация — изменения высоты (мелодия) + нюансы: вибрато, опевания, “подъезды” (Pitch curve).
Артикуляция — работа языка, нёба, челюсти, губ, обеспечивающая произнесение/ пропевание слов.
Именно разделение на 3 компонента придаёт гибкость системе: берём модель тембра, добавляем интонирование в нужной манере и соответствующую языку артикуляцию. Хотите на хинди? Пожалуйста!
Читать далееШесть месяцев назад органический трафик блога держался на отметке 23 000 визитов в месяц. После системного UX/UI рефакторинга с учётом SEO правок он вырос до 76 000. Не за счёт новых статей, не за счёт ссылочного бюджета, а за счёт порядка: в структуре, интерфейсе и техническом фундаменте сайта.
Я Пётр Гришечкин, последние 15 лет проектирую системы кратного роста трафика для крупных сайтов. Делюсь разными разборами в своём канале.
Ниже – разбор того, что именно было сделано, в какой последовательности и что реально повлияло на результат.
Читать далееСегодня мы рассмотрим несколько исследований, посвященных использованию Wi-Fi в задачах визуализации. Речь пойдет не только о том, как «увидеть» движение внутри помещений, используя информацию о состоянии канала (CSI), но и о попытках визуализировать комнату и даже сам процесс распространения радиосигналов.
Читать далееВ предыдущей статье мы обсуждали некоторые меры, которые пользователь может предпринять против spyware, детектирующего факт использования VPN и сливающего полученные данные “Большому брату”.
Если судить по комментариям (и автор в целом согласен с их логикой), то в условиях тотального стукачества иных выходов, кроме как иметь два смартфона (а, возможно, и два десктопа!), действительно почти не остаётся. На первый взгляд это и правда так.
Однако если немного подумать, то окажется, что техническое решение всё-таки есть. Да, оно относительно дорогое (минимальные расходы около 1000-1500 рублей в месяц), но оно существует!
Если интересна архитектура VPN-сервиса, устойчивая к наличию spyware на клиенте, то
добро пожаловать под катВсем привет!
У меня есть публичный проект Архитектурные Этюды, в котором мы сообществом решаем реальные архитектурные задачи. Подумал сделать цикл статей, в котором представить анализ представленных проблем с учетом обсуждений участников и показать как могут выглядеть решения при всестороннем архитектурном рассмотреи. Первым кейсом выбрал «Хранение классифицированных данных», он не сложный, для многих – актуальный, поэтому выбор пал на него.
Читать далееКаждый новый чат с Claude Code начинается с нуля. Агент не знает ваш проект, не помнит что вы обсуждали час назад, и на шестой раз всё равно полезет “чинить” конфиг который работал нормально. А ещё каждую неделю в r/ClaudeAI новая история про удалённую базу или запушенные секреты.
Типичный CLAUDE.md на 5-10 строк не решает ни одну из этих проблем. У меня это выросло в 582 строки и 6 слоёв - rules, memory, handoffs, chronicles, hooks, skills. За каждым правилом стоит конкретный инцидент. В статье - три истории которые всё изменили, и открытый репозиторий с 17 принципами из 37 arxiv papers.
Читать далееЗащита конфиденциальных данных — одна из главных проблем при работе с LLM. Главное, чтобы облачный «вычислительный движок» выполнял работу только над зашифрованными данными, не имея доступ к открытой информации. В качестве решения проблемы предлагается полностью гомоморфное шифрование запросов (FHE). Оно позволяет организовать полностью зашифрованный канал между двумя пользователями (E2E) с сервером посредине между ними.
Проблема только в том, что зашифрованные вычисления FHE в десятки тысяч раз медленнее обычных, а размер шифротекста FHE в десятки раз больше оригинала.
На Международной конференции по твердотельным схемам IEEE (ISSCC) в Сан-Франциско компания Intel представила прототип чипа Heracles, ускоряющий вычисления FHE до 5000 раз по сравнению с лучшими серверными CPU. И это не единственный FHE-ускоритель в разработке.
Читать далееЕщё вчера для запуска 26-миллиардной нейросети нужен был дата-центр. Сегодня достаточно ноутбука и одной консольной команды.
Встречайте: Google Gemma 4 26B-A4B. Модель, которая ломает старые правила. Архитектура mixture-of-experts (128 экспертов, 8 активных на токен) позволяет ей работать на скромных 48 ГБ объединённой памяти, выдавая при этом качество, сопоставимое с гигантами вроде Qwen 3.5 на 397B параметров.
А LM Studio 0.4.0 только что сделала локальный запуск таких моделей по-настоящему удобным. Фоновый демон llmster, консольная утилита lms, непрерывный батчинг и – внимание! – эндпойнт, совместимый с Anthropic. Это значит, что вы можете направить Claude Code на свою локальную Gemma 4.
Хотите узнать, как заставить эту связку летать? Как правильно рассчитать память под контекст в 256K токенов и почему спекулятивное декодирование — плохая идея для MoE? А главное — сколько это всё жрёт энергии и греет ли ваш Mac?
Поехали!
Читать далееДа кому вообще нужен облачный гейминг?
Недавно я задался этим вопросом во время дружеской посиделки...
Читать далееЗдравствуйте, я – менеджер продукта в компании «СИБИНТЕК». В прошлом году самому известному и популярному фреймворку для команд, создающих функционально сложные продукты, исполнилось 30 лет. Да, вы правы, речь про Scrum. Несмотря на то, что Scrum про скорость, про разработку короткими итерациями с постоянной обратной связью, сам фреймворк почти не развивается. Мы до сих пор пользуемся гайдом пятилетней давности. И для новых адептов данного подхода может показаться, что Scrum был всегда таким, как он описан в Scrum Guide 2020. И многим даже не приходит в голову посмотреть эволюцию его развития. Например, проанализировать, а что поменялось с прошлого издания 2017 года и, главное, почему. А проследив эти изменения, можно понять ключевые моменты, на которые может быть стоит сфокусироваться современным Scrum-командам. Давайте попробуем это сделать.
Читать далееКогда я впервые всерьёз сел писать AGSL под Android, ощущение было очень странное. С одной стороны - современный графический конвейер, RuntimeShader, RenderEffect, красивые эффекты и весь этот техно-киберпанк. С другой - шейдерный код живёт внутри строковых литералов, uniform-ы приходится объявлять и привязывать вручную, а отладка периодически начинается с философского вопроса: «в какой именно строке я сейчас всё сломал?»
В какой-то момент я поймал очень «кин-дза-дзовское» настроение: вроде перед тобой космическая технология, а инструменты ощущаются так, будто тебе выдали гравицапу без инструкции и сказали: «ну ты это... лети». Можно, конечно. Но хочется, чтобы летели не только самые упорные.
Собственно, так и появился RedByteFX. Я сделал его не только ради собственного удобства. Мне хотелось решить ещё одну задачу: сделать AGSL более массовой и понятной технологией для Android-разработчиков. Потому что в нативном виде AGSL мощный, но психологически для многих выглядит как «не трогай, это на Новый год». А мне хотелось, чтобы к шейдерам можно было подойти без дрожи в коленях и без ощущения, что сейчас придётся разговаривать с господином ПЖ на древнем пацакском наречии.
Читать далее«Красивая картинка» нейросетью — уже не навык. Навык — получить конкретный управляемый стиль для стикеров, мерча или соцсетей. Собрал 6 стилей с готовыми шаблонами промптов: Mixed Media коллаж, Rubber Hose 30-х, Dark Mode минимализм, Street Doodle и другие. Каждый — с конструктором, куда подставляете свои значения. Работает в Midjourney, DALL-E, Stable Diffusion.
Читать далееНекоторое время назад у меня появилась необходимость в x86 ноутбуке-трансформере, который я мог бы брать с собой в дорогу. Поскольку я работаю над будущими статьями и проектами даже на отдыхе, мне нужно было устройство на достаточно производительном процессоре, с приличным объёмом ОЗУ и обязательно шустрым накопителем - я нередко собираю весьма тяжелые проекты. По итогу я остановился на трансформере Ninkear S13 с процессором Core Ultra 5 115U, 16ГБ DDR5 ОЗУ и 1ТБ накопителем, о котором и хочу сегодня рассказать Хабровчанам!
Читать далееЗаконодателями моды в пору юности авиации однозначно были французы. Однако чем «взрослее» та становилась, тем реже они оказывались в авангарде и ко Второй Мировой войне лидерство напрочь упустили. Вновь вернуть его, а заодно сделать облик самолётов реактивной эры принципиально другим могли два Рене – Лорен и Ледюк. Но в итоге предвосхитили скорее облик крылатых ракет.
Читать далееПодписки на рабочие инструменты — ChatGPT, Claude, Cursor — легко набегают на 100 долларов в месяц. А с российской карты половину из них ещё и не оплатить. С осени 2025 я покупаю лицензии и подписки через маркетплейс цифровых товаров. Заплатил 19 000 ₽ за софт, который официально стоит 76 000 ₽. Разница — 57 000 ₽. Один лот слетел (Perplexity — забанили через неделю), но деньги вернули. Остальные пять работают. Разбираю механику: почему дешевле, какие схемы легитимны, где подвох, и показываю свои кейсы с цифрами.
Читать далееЗнаете, что происходит, когда вы ставите Telega, «альтернативный клиент Telegram от ВКонтакте»? Ваш Telegram ID тихо уезжает в инфраструктуру OK/VK Calls. Без уведомлений. Без галочки «я согласен». Просто раз, и вы в индексе. Навсегда.
Я решил проверить, сколько людей в моих чатах уже засветились. Руками долго. Через плагин exteraGram можно по одному профилю за раз. Хотелось масштаба. Так появился antitelega: Go userbot, который сканирует целый чат и выдаёт список «засвеченных» прямо в Saved Messages.
Читать далее2025 год кончился тем, что оперативная память, SSD-накопители и даже старые добрые жёсткие диски теперь стоят как крыло самолёта. Причина — корпорации, которые сделали ставку на ИИ и создают ИИ-продукты, в огромных количествах закупаясь памятью для ЦОДов. Подорожало абсолютно всё — как комплектующие для ПК, так и игровые консоли. Искусственный интеллект повлиял не только на цены, но и на то, как теперь делают видеоигры — и, поверьте, нам есть о чём беспокоиться.
Читать далееУ AI-индустрии есть серьезная проблема: как развернуть вычислительную инфраструктуру раньше и быстрее (да еще и дешевле) конкурентов? Основной дефицитный ресурс сейчас — электричество, а не чипы или их компоненты, как вы могли предположить. Техногиганты думают, где поставить стойки, чем их охлаждать, но главное, где взять энергию, чтобы питать всю AI-систему.
И у одного стартапа из Денвера есть нестандартное решение — портативные модульные AI-дата-центры, которые можно размещать в самых нестандартных условиях. Компания пришла в ИТ из мира крипты: изначально она вела деятельность установкой майнинг-машин, которые брали энергию от попутного газа на нефтяных вышках.
Сегодня я расскажу вам о компании Crusoe — которая крайне нестандартно превращает энергию в вычислительную мощность. Разберем их бизнес-модель и поймем, что такое вертикально интегрированная AI-инфраструктура.
Читать далееЖил-был я. И был у этого "я" небольшой пул виртуальных машин. Но пришло время, и появилось осознание, что у моего облачного провайдера (пусть будет С) не все условия мне нравятся. А, вот, у другого провайдера (путь будет провайдер В) условия для некоторых виртуалок повкуснее. И замыслил я неладное. Я решил разнести инфраструктуру между разными провайдерами. Но эту, так называемую, инфру необходимо скоммутировать между собой. Потому что гонять сервисный трафик через интернеты - дурная затея. И родился у меня план. Даже не так ПЛААААН!!! А следом, и эта статья. Предвосхищая вопросы почему не обычный VPN, отвечу: это во-первых, скучно, во-вторых, не подлежит публикации, в-третьих, в последнее время нестабильное ввиду блокировок. Disclaimer! Цель статьи - рассмотреть вариант осуществить связность конкретных элементов инфраструктуры, используя публичные каналы связи. Статья не ставит целью описать способ обхода блокировок и осуждает (хоть и не искренне) подобные статьи.
А ну ка?