В крупных компаниях доступ к данным доступен аналитикам и частично продактам, которые знают SQL, структуру данных, бизнес-логику расчёта метрик. В результате маркетинг, продукт, продажи и финансы зависят от аналитиков, которые превращаются в бутылочное горлышко.
В OLX, одна из моих зон ответственности — это эффективность привлечения трафика. У нас есть регулярный поток ad-hoc задач от маркетинга и финансов, требующих ресурсы дата-инжинеров и аналитиков. Мы хотели сократить эту зависимость и создать удобный интерфейс для получения ответов из уже существующего аналитического контура.
Так появилась идея Talk2Data — внутреннего AI-агента в Slack, который позволяет задавать вопросы к данным естественным языком и получать ответы без написания SQL.
Читать далееДанная статья посвящена основе основ нейронауки — линейной алгебре. Если вы когда-либо планируйте изучать искусственные нейронные сети (и не только), то вам необходимо начать именно с этого. Причем не важно, собираетесь ли вы заниматься фундаментальными исследованиями (Data Science) или просто лепить модели в продакшн на конвейере (ML Engineering), вы обязаны знать их математику хотя бы поверхностно. Любые настройки, дообучение и применение даже готовой модели, требуют понимания основ. А по сему данное знание, как минимум, не будет избыточным.
Материал рассчитан на новичка. Если вы знаете школьную математику, то сможете освоить и мой курс. В будущем я напишу статью о линейном представлении нейросетей, где мы адаптируем полученное знание под прикладные задачи, напишем некоторые слои на Python и построим настоящую модель!
В этой статье:
* Понятие вектора;
* Векторизация данных;
* Умножение на скаляр;
* Сложение векторов;
* Норма вектора;
* Скалярное умножение;
* Векторное умножение;
* Практика с кодом;
* Домашняя работа.
Все будет объяснено на красочных примерах в игровой форме. Ничего сложного. А в конце вас ждет самостоятельная практика с кодом.
Приятного чтения!
Читать далееНу, не ваша, хабравчане, а ваша, создатели языков, библиотек, фреймворков итд. Но давайте не забегать вперёд.
Я как-то привык что если что-то ломается или плохо работает, то это я виноват. Это называется «брать ответственность за свои поступки» или, в случае программиста, за свой код, и это считается хорошим делом.
Разумеется, по эго это бьёт иногда больно, и некоторые моменты вспоминать не очень приятно. Самое страшное, что я когда-либо делал — коммитил приватный ключ в публичной репо. Вот написал и мне опять стыдно. Но я осознаю, что это всё я.
Но внезапно я открыл для себя тот факт, что не во всех ошибках моя вина. То есть да, это моя голова думает код, это мои руки печатают этот код, но ошибка идёт не от меня. Ошибка заложена ещё раньше, вообще задолго до меня, а иногда даже задолго до моего рождения.
Сейчас я вам это покажу. Будет интересно, но впереди много боли. Я предупредил.
Хочу страдатьКогда у компании много сервисов и данных, то лучше всего иметь план Б на любую ситуацию, например когда нужно быстро оптимизировать ресурсы и работать в режиме «минус один дата‑центр» без просадок, в то время как утилизация серверов при этом стремится к 100%. Смертельный номер? Вполне посильная задача, с которой справилась команда Яндекс Go.
Мы провели аудит и поняли, что у нас очень много синхронных походов из критичных сервисов в некритичные, а ещё и поллинг. И это требовало внедрения событийной модели. Тысяча микросервисов, 150 команд разработки, несколько языков программирования, и у каждого разработчика своё представление о том, как правильно читать сообщения из Kafka. Библиотека, которую мы раздали командам, быстро бы обросла форками, заплатками и костылями.
За шесть месяцев командой из шести человек мы превратили эту библиотеку в централизованную платформу Немезида. Сейчас на ней крутится больше 500 интеграций, а новую можно запустить меньше чем за четыре часа.
Меня зовут Алексей Терентьев, я руководитель одной из служб отдела эффективности Яндекс Go. В этой статье я расскажу, как мы прошли путь от простого «прочитал — обработал — закоммитил» к по‑настоящему масштабной архитектуре: со всеми граблями, факапами и конкретными решениями.
Читать далееСегодня полностью погрузимся в мир TTS (Text-to-Speech) — новое русло нейросетей, призванных облегчить жизнь и отобрать работу у профессиональных дикторов, актеров и тех, чей голос мы привыкли слышать в любимых фильмах.
Рассмотрим бесплатные модели, не требующие кредитов, подписок или трех цифр на обороте карты. Заранее обозначу, что не все модели поддерживают русский язык, а у некоторых присутствует своеобразный акцент, как у Шварценеггера из фильма «Красная жара».
Я буду генерировать озвучку не только на английском, но и на русском языке, чтобы понять, насколько отличается качество звучания и произношения, и можно ли вообще использовать эти модели, закрыв глаза на ограничение языков.
Читать далееКак создавать пользовательские типы данных в открытой АСУТП? Зачем объединять скорость, температуру и статус двигателя в одну переменную?
В ИТ-команде «Северстали» мы занимаемся разработкой компонентов для открытой АСУТП. В этой статье разберём, как создавать и применять пользовательские типы данных в нашей среде разработки Flogic.
В этой статье вы узнаете, как структурировать данные, повысить читаемость кода и переиспользовать тип переменных по всему проекту.
Читать далееПривет!
Это восьмой выпуск Frontend Status — дайджеста по фронтенд-разработке.
В этом выпуске — CodePen 2.0 и клон Loom на Next.js в видео; про AI: почему коллекция промптов не заменяет мышление, автоисследования на игровом PC и онбординг через Oncode. Безопасность в центре: Clinejection (4000 машин через GitHub-issue), как GitHub защищает агентские воркфлоу, укорочение срока жизни TLS-сертификатов, веб-агенты, сливающие данные пользователей, и 22 CVE в Firefox после проверки кодовой базы Claude. В CSS — все способы выбрать <html>, война z-index и подводный камень Anchor Positioning; в JS — когда пора переходить на Rust, разбор requestAnimationFrame и постмортем npm-червя Shai-Hulud. По фреймворкам: ретро-компоненты и cron-генератор в React, микрофронтенды в Angular 21. Веб-стандарты: обновление WCAG 3 и отчёт TC39 про ES2026. Браузеры: Chrome переходит на двухнедельные релизы, Edge предлагает атрибут focusgroup. Плюс VS Code 1.111 с инфраструктурой для Copilot-агентов, «убедительный дизайн» и усталость от токенов, TDD в эпоху AI, элемент <geolocation>, AT Protocol под капотом Bluesky и запуск Cursor-агентов из Telegram.
ЧитатьВ ноябре учёные прибыли на Южный полюс на самолётах с лыжами вместо колёс, чтобы осуществить строительный проект, который готовили семь лет.
У них было короткое летнее окно — с ноября по начало февраля — чтобы пробурить шесть новых отверстий глубиной не менее двух с половиной километров в антарктическом льду и установить длинные кабели, увенчанные сотнями шарообразных детекторов света. Эта плотная сеть датчиков — модернизация нейтринной обсерватории IceCube, огромной системы, построенной 15 лет назад и состоящей из более чем 5000 датчиков, встроенных в гигатонну льда.
Все эти устройства ищут мимолётные следы нейтрино — самых загадочных частиц из всех известных.
Читать далееПривет, Хабр!
Меня зовут Алекс, и я мейнтейнер Symbiote.js - библиотеки для создания UI-компонентов и изоморфных приложений на самых современных веб-стандартах. Сегодня я расскажу про наше важное мажорное обновление - версию 3.x.
Читать далееПривет, Хабр! Меня зовут Настя, я работаю методологом в команде проекта Route 256 — онлайн-курсов продвинутой разработки от экспертов Ozon Tech. В этой статье мы обсудим, что делать, если в жизни становится слишком много информационного контента.
Например, у вас уже несколько месяцев остаются открытыми 15 вкладок «почитать потом», в закладках лежит «идеальный роадмап по Go», а в рекомендациях — «10 must-watch-докладов про архитектуру». В IT это особенно заметно: технологии и инструменты обновляются быстро, а вокруг постоянно есть поток учебных материалов, чтобы оставаться в теме. Нужно с этим что-то делать или нет?
Читать далееСтатья основана на личном шестимесячном опыте автора по внедрению Cursor в процессы разработки моделей, сервисов и MLOps-процессов. Делается вывод, что роль разработчика смещается от написания кода к постановке задач, проектированию архитектуры и контролю качества, при этом ИИ берёт на себя реализацию и рутинные операции.
Читать далееМассовое применение и внедрение ИИ-технологий среди обычных потребителей случилось буквально пару лет назад. В 2023-м нас всех поражала возможность ChatGPT писать логически складные и осмысленные абзацы, а качество картинок с Midjourney вообще вызвала ажиотаж и беспокойство о будущем профессий художника и дизайнера.
И ИИ-контент еще не выглядел так инородно: если сегодня каждый третий Shorts или картинка в соцсетях сгенерированы, то в 2023 году многим и в голову не могло прийти, что картинку можно нарисовать нечеловеческими «руками».
И именно в тот год один ушлый художник решил провернуть перформанс, который зашел слишком далеко. Настолько, что смог обмануть весь Twitter (X) и кучу авторитетных зарубежных СМИ, включая The Verge, Tom Hardware и TechRadar.
Имя авантюры: Del Complex — независимый плавучий город с 10 тысячами GPU-ускорителей H100 на борту посреди океана. Вспомним, как это было и как удалось разоблачить эксперимент одного художника.
Читать далееПродолжаем цикл статей о движении двигателестроительных компаний по пути импортозамещения зарубежного ПО. Сегодня снова расскажем о применении среды математического моделирования Engee в процессах разработки систем управления газотурбинными двигателями.
Если мы говорим, что само по себе двигателестроение - это наукоёмкая отрасль, и работают в ней буквально десяток компаний в мире, то разработка электронных блоков управления этими двигателями - ещё более узкая отрасль промышленности. В России этим занимаются только пара-тройка компаний и одна из них - пермская ОДК-СТАР из контура Объединённой Двигателестроительной Корпорации. Проектирование систем управления двигателями - их непосредственная специализация, а номенклатура продукции включает системы автоматического управления не только авиационными двигателями, но также и ракетными, морскими двигателям и промышленными турбинами.
Читать далееВ последнее время особенно популярными стали дипфейки и цифровые аватары, которые используются, надо признать, не всегда для благородных целей.
Законодатели во многих странах пытаются разрешить возникающие ситуации, например, даже путем ужесточения уголовного наказания. Однако, это не останавливает возможных нарушителей. Качественный уровень подделок растет, как и увеличивается количество преступлений подобного типа по всему миру.
Читать далееВ профессиональной среде распространено убеждение: если руководитель владеет современными управленческими инструментами – тайм-менеджментом, фасилитацией, эмоциональным интеллектом, – он защищен от выгорания. Логика кажется безупречной: чем больше навыков, тем легче справляться с нагрузкой. Однако на практике многие грамотные, обученные и опытные управленцы оказываются на грани истощения. Это заставляет предположить, что проблема лежит в иной плоскости: навыки управления – это не ресурс, а инструмент. А любой инструмент требует энергии для своего применения.
Skill ≠ ресурс
Управленческие навыки – это когнитивные схемы и поведенческие алгоритмы. Они помогают эффективнее решать задачи, но сами по себе не восполняют энергию. Более того, их осознанное применение требует дополнительных когнитивных затрат.
Психолог Рой Баумайстер обнаружил интересный эффект, который назвал «истощением эго». Оказывается, наша способность контролировать себя и принимать волевые решения – не бесконечна. Это как мышца: если ее напрягать, она устает. Для руководителя это значит, что каждое сознательное усилие – например, внимательно выслушать подчиненного, сдержать раздражение в конфликте или удержать фокус на стратегии – расходует внутреннюю энергию. Если действовать на автомате, мы почти не тратимся, а вот осознанное применение навыков быстро истощает ресурс.
Психологи предложили удобную схему, чтобы разобраться, откуда берется усталость на работе. Они разделили все, с чем мы сталкиваемся, на две большие группы. Первая – это то, что высасывает силы: например, горящие дедлайны, ссоры с коллегами или вечная неопределенность. Вторая – то, что, наоборот, подпитывает: возможность самому принимать решения, поддержка команды, честная обратная связь. Если первого слишком много, а второго не хватает, мы неизбежно выдыхаемся.
Читать далееТимлиды и команды в больших компаниях постоянно сталкиваются с одной и той же проблемой: бизнес хочет знать сроки, а разработка не может их назвать. Оценки «пальцем в потолок», спринты без delivery, злые заказчики и выгоревшие разработчики — знакомо?
«Три карандаша» — это метод инженерного груминга, который я разработал в боевых условиях и который сейчас стал частью стандарта разработки в Газпромбанке. Суть простая: вы берете доску, три цветных маркера и за два часа превращаете размытые бизнес-требования в понятный план работ с реалистичными сроками. Он подходит для любых задач: фронтенд, бэкенд, data science, интеграции. Если вы можете разложить работу на логические шаги — вы можете использовать три карандаша.
Всем привет. Меня зовут Рустам Файзулин. 30 лет BE- и data-science-разработчик, последние семь лет работаю коучем в Газпромбанке. Моя задача — сделать так, чтобы разработчики понимали, что надо сделать, а бизнес понимал, когда он это получит. Дальше расскажу, как родился мой метод, как он устроен и как внедрить его у себя.
Читать далееУ каждого из нас есть право контролировать использование своих биометрических данных, к которым относится и цифровое описание уникальных черт лица. Проблема в том, что системы видеонаблюдения и аутентификации с функцией распознавания лиц основаны на «патологически памятливых» нейросетях. Однажды увидев лицо, нейросетевая модель запоминает его навсегда, создавая риски для приватности. Из-за этой особенности глубокой нейросети вас могут отслеживать, даже когда это не является необходимым и правомерным. Юридическое «право на забвение» вступает в конфликт со сложностью его реализации.
Эту проблему исследовал специалист лаборатории искусственного интеллекта российской ИТ-компании «Криптонит» Михаил Захаров. Он разработал уникальный метод выборочного забывания лиц системами компьютерного зрения (CVS). Предложенный метод можно использовать для удаления образов лиц из различных систем биометрической идентификации, не нарушая их функциональность.
Читать далееКак известно, в РФ почти полностью заблокировали WhatsApp* (принадлежит запрещённой организации), а будущая работа Telegram под вопросом. Звонков уже не осталось, только текстовые сообщения, передача файлов тормозит. Судя по всему, начался шейпинг трафика. А если эффективен шейпинг, то сработает и полная блокировка, которую планируют в первых числах апреля, по слухам от РБК.
У нас остаётся всё меньше рабочих способов общения. Если отбросить совсем странные варианты вроде Google Docs или Max, то самая оптимальная альтернатива — это опенсорсные мессенджеры, такие как XMPP (Jabber) и Matrix/Element. Для максимальной надёжности такого общения в федеративной сети желательно поднять свой собственный сервер. Это можно сделать на домашнем сервере или VPS.
Тема актуальна в том числе для закрытых сообществ, которые раньше общались в группах Telegram, WhatsApp* (принадлежит запрещённой организации) и Viber. Родственники, корпоративные рабочие команды, домовые чаты, игровые сообщества и др. Теперь их можно перенести в Matrix/Element на своём сервере.
Читать далееИз-за того, что большинство “айтишных технологий”, таких как Wi-Fi или сотовая связь живут на участке спектра 400 МГц - 6 ГГц, у многих инженеров начало смазываться понятие длины волны (λ).
Точнее не так. Они оперируют этим понятием очень узко, применительно к той полосе частот на которой работают. Что нам может сказать термин λ? То, что при прочих равных (коэффициент усиления антенны, мощность передатчика, потери на тракте и пр.) сигнал с бОльшей длиной волны (и меньшей частотой) сможет преодолеть бОльшее расстояние.
Ошибка ли это? Ни в коем случае, все так и есть. Но это очень узкий подход. По незнанию его можно начать применять слишком буквально. И открыть для себя, что эти зависимости чуть сложнее, чем кажутся на первый взгляд. Рука об руку с длиной волны идет такой термин, как «распространение в средах». У каждого диапазона есть свои особенности в отношениях со средой.
В этой статье мы пробежимся по фундаментальным основам физики и узнаем, какое практическое влияние окажет на сигнал тот или иной диапазон. Постараюсь описать это с минимальным занудством и понятным широкому кругу читателей языком.
Читать далееВчера выкатили 3 релиза, а сегодня поддержка ловит очередной инцидент, но уже непонятно, какой именно релиз его вызвал. Знакомая картина?
Проблема в том, что вы не видите связи между тем, что выкатываете на продакшен, и тем, что ломается после этого. А когда связь теряется, релизы превращаются из инструмента развития в источник непредсказуемых сбоев.
Привет, меня зовут Артем Герасимов, я владелец продукта SimpleOne SDLC. В этой статье я расскажу вам, как слишком частые релизы могут негативно сказываться на качестве продукта и что с этим можно сделать.
Читать далее