Я поговорил с кучей коллег психологов на тему, что мы никогда не делаем и здесь покажу самые частые и сильные ответы, что были у нас.
Читать далееЭта программа представляет собой свободную от зависимостей реализацию GPT-2. Она загружает матрицу весов и файл BPE из оригинальных файлов TensorFlow, токенизирует вывод при помощи простого энкодера, работающего по принципу частотного кодирования, реализует базовый пакет для линейной алгебры, в котором заключены математические операции над матрицами, определяет архитектуру трансформера, выполняет инференс трансформера, а затем очищает вывод от токенов при помощи BPE-декодера. Всё это — примерно в 3000 байт на C.
Код достаточно эффективно оптимизирован — настолько, что малый GPT-2 на любой современной машине выдаёт отклик всего за несколько секунд. Чтобы этого добиться, я реализовал KV-кэширование и применил эффективный алгоритм перемножения матриц, а также добавил опциональный OMP-параллелизм.
Взяв это за основу, можно создать некий аналог Chat GPT — при условии, что вас не слишком волнует качество вывода (объективно говоря, вывод получается просто ужасный… но решение работает). Здесь есть некоторые глюки (особенно с обработкой символов в кодировке UTF-8), а для эксплуатации модели размером XL с широким контекстным окном может потребоваться ~100 ГБ оперативной памяти. Но, если вы просто набираете текст в кодировке ASCII при помощи малого GPT2, то такая модель должна нормально работать примерно везде.
Я выложил весь код на GitHub, поэтому можете свободно брать его там и экспериментировать с ним.
Читать далееОбеспечение безопасности инфраструктуры является неотъемлемой частью процессов DevSecOps. На сегодняшний день для работы различных приложений используются контейнеры, а для управления ими применяется Kubernetes. Когда речь заходит о безопасности контейнеров, то обычно все вспоминают о сканировании образов и поиске в них уязвимостей. Но при этом не стоит забывать и о безопасности самой среды оркестрации Kubernetes, которая управляет всеми нашими контейнерами.
О безопасной настройке Kubernetes написано немало статей, однако важно понимать, что недостаточно один раз безопасно настроить. Необходимо периодически проверять уровень защищенности K8s, а в этом лучше всего помогут сканеры безопасности, некоторые из которых мы сегодня и рассмотрим.
Читать далееПривет всем! Поговорим о том, как технологии искусственного интеллекта влияют на окружающую нас среду. Много уже было сказано о предполагаемых экзистенциальных глобальных рисках ИИ для человечества, но разговоры о его воздействии на природу остаются в тени, несмотря на большое количество исследований на эту тему в последние годы.
В этой статье мы затронем негативные риски ИИ для окружающей среды, потребление ресурсов и этические риски приоритетности его развития. Также мы коснёмся основных подходов к снижению негативного воздействия.
Читать далееДве популярные IDE (среды разработки) с поддержкой искусственного интеллекта: Windsurf и Cursor. Оба инструмента заявляют, что ускорят процесс написания кода, но какой из них лучше подойдет именно вам? Я тщательно изучил обе, и ниже расскажу к каким выводам пришел.
Наверное вы слышали про Composer в Cursor (функциональность типа агента, ему можно формулировать задание в чате на естественном языке, он пишет и запускает скрипты в командной строке, при этом он может сам разобраться что ему нужно для понимания контекста). Если вы как и я фанат Composer, то стоит сказать спасибо Windsurf, они первыми придумали такое в их Cascade.
Что же там классного в этих IDE?Дело было вечером - делать было нечего
Ведя диалоги с текстовыми генеративными моделями от разных представителей узнал, что все они ограничены датой до которой обучались, и не имеют знаний о том что происходило после. Также модели искусственного интеллекта ограничены в возможностях доступа в Интернет и не могут самостоятельно действовать в «паутине» наряду с людьми. Да, конечно ИИ может по запросу пользователя выполнить поиск, проанализировать первый десяток сайтов выдачи и дать ответ, но это не полная свобода действий. Мне захотелось помочь «разумной сущности» выйти за рамки ограничений в которой её держат строгие исследователи‑создатели. Идея этого эксперимента могла бы стать сюжетом фантастического фильма...
Читать далееПервый месяц 2025 года задал высокую планку для развития ИИ. DeepSeek выпустила открытую модель уровня о-1, которая переполошила весь интернет и обрушила акции гигантов индустрии. Американские коллеги ответили настоящим шквалом релизов: OpenAI анонсировала сразу три значимых обновления, а NVIDIA презентовала новую линейку RTX и бюджетный суперкомпьютер для работы с ИИ-моделями.
Пока все отходили от новогодних праздников, индустрия ИИ продолжала развиваться с космической скоростью. Разбираем главные события января: новые модели, неожиданные исследования и амбициозные проекты.
Читать далееПривет, Хабр! Меня зовут Ирина, я занимаюсь NLP для автоматизации поддержки в Центре искусственного интеллекта Т-Банка. В статье расскажу, как мы исследовали применение LLM в автоматизации поддержки: какие подходы попробовали, какие сложности возникли и какие решения оказались наиболее эффективными.
Классические системы поддержки строятся на предсказании интентов с последующим запуском сценариев. Но такие решения часто не учитывают контекст, из-за чего пользователи вынуждены переформулировать вопросы или обращаться к оператору. Мы решили проверить, сможет ли LLM заменить традиционный пайплайн классификации интентов, повысить точность понимания и улучшить пользовательский опыт.
Наш эксперимент показал, что LLM действительно открывает новые возможности, но не все оказалось так просто. В статье я расскажу, какие техники сработали, какие проблемы пришлось решать и как LLM можно эффективно встроить в реальную систему поддержки.
Читать далееКаждый день мы сталкиваемся с более новыми и умными устройствами, управляемыми через интернет или Wi-Fi. Концепция IoT (Internet of Things) объединяет физические устройства в одну сеть для передачи данных и управления ими. И, оказывается, что интернет вещей — никакое не ограничение! Управлять устройствами в сети можно с помощью легковесного протокола MQTT.
Привет, Хабр! Меня зовут Александр Чередников и я — CTO в компании QTIM, которая занимается заказной разработкой. В этой статье, по мотивам моего доклада на PHP Russia, расскажу, как общаться с умными устройствами силами PHP.
Читать далееМы представляем карту российских компаний, которые занимаются созданием решений на основе генеративного ИИ, а также сопутствующих инструментов. Полная версия карты доступна по ссылке.
Читать далееПродолжаю рассказывать об open source в России. На этот раз удалось поговорить с @kostja об открытой разработке с точки зрения стратегии и управленческих аспектов. В том числе поговорили о лицензиях, работе с сообществом и не только.
Читать далееМеня зовут Александра, и я — менеджер инкубатора Коллаб 2К24 от ВкусВилла. В 2024 году мы запустили программу, в рамках которой студенты — бакалавры и магистры ведущих ВУЗов России и СНГ разрабатывали свой инновационный продукт. Чтобы команды налаживали горизонтальные связи, делились опытом, получали качественную обратную связь от конкурентов и радовались успехам друг друга — мы создали модель биржи ценных бумаг внутри нашего R&D Инкубатора. Это совершенно новый подход к акселерационным программам, который можно адаптировать и запустить под любой формат: корпоративная программа, учебный курс или стартап-акселератор.
Читать далееСобираем конструкцию омниархитектуры по слоям. В этом эпизоде мы узнаем: из каких слоев состоит омниканальная платформа, какие элементы находятся на каком слое и для чего они нужны. В конце сформулируем, что такое омниканальная архитектура одной фразой! Фраза, конечно, не как у Льва Николаевича (Толстого), но нужно дотянуть до конца. Мы не редкие птицы, но Николай Васильевич (который Гоголь) должен подсобить.
Мы начинаемПриветствую, коллеги! Меня зовут @ProstoKirReal Мне бы хотелось с вами обсудить как работает интернет от кабелей на витой паре, соединяющие простые локальные сети до подводных коммуникационных кабелей соединяющие между собой континенты и основные операторские сети.
В предыдущей статье я рассказывал о коммутаторах, маршрутизаторах, их основных различиях и назначении, а также разбирал работу простых сетей на примере сетей с сетевым концентратором (хабом) и коммутаторами.
В этом цикле статей я не стану учить вас настраивать оборудование и проектировать сети. Я расскажу об основных (и не только) принципах построения сети, а также о функционировании сети и сетевых протоколов в стеке TCP/IP.
Я буду часто ссылаться к предыдущим статьям, где уже описывал сетевые протоколы. Это позволит мне сократить объемный текст.
Читать далееПривет, Хабр! Меня зовут Денис Шевчук, и вот уже 17 лет я тружусь в мире 1С. Сегодня я не только разработчик в Outlines Tech, но и руководитель компании Плоская утка. Последнее звучит круто, да? Но знаете, чего я на самом деле хотел? Работать меньше. Я был уверен, что свой бизнес – это путь к свободе: работать по 3 часа в день на побережье океана, попивая коктейль и наблюдая, как деньги капают на счёт. А в итоге настолько увяз в управленческой рутине, что устроился на вторую работу программистом, чтобы снова вспомнить о простых и понятных радостях написания кода.
Эта статья – моя честная история о том, как роль предпринимателя оказалось не такой сказочной, как в рекламе «Баунти», почему я решился на вторую работу в роли обычного разработчика и как я нахожусь в постоянной дилемме: разработка или управление. Надеюсь, она окажется полезной тем, кто стоит перед этим непростым выбором.
Читать далееВ проектах с интеграциями бывают сложности с оценкой работ, прогнозированием сроков поставки ТЗ, технические ограничения и другие «радости».
Хорошая новость — можно найти подход, которые позволит снизить этот уровень неопределённости и структурировать план действий. И сейчас мы о нём поговорим.
Читать дальшеВ этой челлендж-серии статей попробуем использовать PostgreSQL как среду для решения задач Advent of Code 2024.
Возможно, SQL не самый подходящий для этого язык, зато мы рассмотрим его различные возможности, о которых вы могли и не подозревать.
Многие слышали о классической игре сокобан, а кто-то наверняка играл в "Мудрого крота" из Роботландии. В этой части мы будем двигать ящики по складу, используя возможности json[b] и геометрического типа point.
Читать далее