Habr.com

Syndicate content Хабр
Все публикации подряд на Хабре
Updated: 50 min 37 sec ago

MLечный путь 2025 — знания, опыт, коммьюнити. Как это было?

56 min 47 sec ago

Привет, Хабр! 23 апреля мы провели в Петербурге митап для ML-специалистов. Спикеры обсудили запуск LLM в продакшен, оптимизацию GPU-инференса, а также Edge-решения для медицины и агросектора. Минимум теории — больше кейсов от Selectel, Cloud.ru, Celsus и Русагро.

Как подобрать инфраструктуру под LLM? Как контейнеризировать GPU в многоарендных средах? Как запускать ML на комбайне или медицинском поезде без интернета? На эти вопросы ответили в четырех докладах на MLлечном пути.

А еще мы организовали питч-сессию для стартапов. Пять проектов на стадии pre-MVP боролись за призовой фонд в 100 000 бонусов. Победителей выбирали сами зрители. В тексте рассказываем, как все было. Читать дальше →

API для перевода на 100+ языков

58 min 55 sec ago

Всем привет! Меня зовут Алексей Рудак, и я – основатель компании Lingvanex, которая уже 8 лет занимается решениями в области машинного перевода и транскрипции речи. 

За последний год мы сильно переработали наше API переводчика, сделав его максимально удобным и быстрым для интеграции. Формат запроса теперь совпадает с  Google, поэтому переход на наше API занимает в районе 5 минут. Более того, сильно выросло качество перевода. Наши языковые модели включают в районе 500 млн параметров и оптимизированы только на одну задачу - перевод.

Наша ближайшая цель - сделать сделать лучший перевод на популярных языковых парах и постепенно мы к ней движемся. Каждые 2 недели выходит апдейт, который повышает качество перевода. Почему две недели ? Это среднее время одной тренировки языковой модели. Всего у нас 240 языковых моделей размером от 120 до 560 mb, которые можно развернуть локально даже на слабых игровых видеокартах типа RTX 3060.

Ниже для примера представлены результаты тестов качества для перевода с английского на арабский язык. Сейчас перевод на арабский больше всего интересен наши клиентам, которые ходят зайти на этот рынок. Стоит отдельно отметить результаты тестов  на датасетах (NTRex-128, Flores-101, WMT24++) так как это наиболее распространенные виды тестов среди ученых и бизнеса. Зеленым цветом выделены числа, где у нас лучше качество, чем у конкурентов, красным - где хуже. В колонке Lingvanex качество сравнивается между нашей новой и предыдущей моделью.

Читать далее

Переход от монолита к микросервисам

1 hour 3 min ago

Привет! Меня зовут Игорь Шаталкин, я разработчик-эксперт в CUSTIS. В этой статье продолжим обсуждение монолитов и микросервисов. Опираясь на практический опыт компании CUSTIS, я рассмотрю ключевые особенности перехода от монолита к микросервисам: когда это необходимо и как это осуществить.

Читать далее

Безграничная ламповость HolyJS

1 hour 5 min ago

7–8 апреля прошла самая крупная в РФ IT‑конференция, просвещённая JavaScript development и всему с ней связанному.

Итак, HolyJS — пожалуй самая крупная «семья» во всем сообществе javascript‑разработчиков, продуктивности и дружелюбности которой можно бесконечно поражаться и восхищаться! Ребята собирают под своим крылом лучших экспертов‑спикеров со всей России...

Читать далее

[Перевод] IQ — во многом псевдонаучный обман

1 hour 13 min ago

СПОР ЗАКРЫТ (2025) Спор теперь можно считать закрытым благодаря статье Брауна, Вая и Чабриса, которые пытались опровергнуть текст ниже, но вместо этого подтвердили все его выводы. Их статья — самая свежая на тему IQ, основанная на исследованиях нескольких групп людей, — невольно показала, что IQ почти ничего не объясняет: ни успехи в образовании, ни достижения в профессии, ни… доход! И это несмотря на всю круговую логику. Я не замечал эту статью до 2024 года.

Читать далее

[Перевод] Объяснение графических процессоров для тех, кто привык работать с ЦП

1 hour 15 min ago

За годы работы я подробно изучил, как центральные процессоры (CPU) выполняют код и как они устроены внутри. Дело в том, что я участвовал в разработке ядра Linux и ScyllaDB, а этот код очень близок к металлу. Я даже немного баловался с Verilog, безрезультатно попытавшись собрать моё собственное ядро RISC-V.

Графические процессоры (GPU) в отличие от обычных в основном оставались для меня чёрным ящиком, несмотря на то, что поработать с ними всё-таки довелось. Помню, что экспериментировал с NVIDIA RIVA 128 или чем-то подобным, проверяя, как там работает DirectX. Тогда такие процессоры ещё не выделялись на фоне ускорителей 3D-графики. Я также пытался идти в ногу со временем и немного упражнялся в программировании элементарных шейдеров на современных GPU. Но я никогда глубоко не вдавался в работу с GPU, и мои взгляды можно назвать CPU-центричными.

Однако, поскольку сегодня наблюдается всплеск рабочих нагрузок, связанных с ИИ, и, в частности, приходится работать с большими языковыми моделями (БЯМ), графические процессоры становятся незаменимыми для современных вычислений. К задачам, решаемым с применением ИИ, относятся масштабные прикладные тензорные операции, в том числе — сложение и перемножение матриц. А это уже работа для GPU. Но как современный GPU выполняет их, и насколько при этом возрастает эффективность по сравнению с выполнением таких же рабочих нагрузок на CPU?

Читать далее

Распределённый инференс и шардирование LLM. Часть 2: скрипт vLLM, Ray Serve для вывода API и настройка KubeRay Cluster

1 hour 20 min ago

Продолжаем пошагово разбираться с ответом на вопрос о том, как эффективно работать с передовыми LLM, используя доступное оборудование и распределённые вычисления. 

В первой части статьи мы подготовили всё необходимое для развёртывания распределённого инференса с Ray Serve и vLLM. Сегодня этим и займёмся. Мы напишем скрипт vLLM, используем Ray Serve, чтобы предоставить внешний HTTP API, а также настроим KubeRay Cluster и развернём в нём Gemma 3.

Вперёд!

Как работать с моделью числа II

1 hour 24 min ago

Содержание текста статьи у некоторых читателей Хабра вызвало определенный интерес (судя по комментариям). Что в общем-то не удивительно, так как тема статьи весьма актуальная для современного общества – информационная безопасность. Специалисты проявляют интерес и активно разрабатывают тему с момента открытия двухключевой криптографии и односторонних функций (около 50 лет).

На самом деле проблема гораздо шире границ предметной области – информационная безопасность, что можно понять уже из рассмотрения частной задачи – факторизации числа. Математики в разных частях и странах мира на протяжении многих тысячелетий пытаются решить задачу разложения большого числа (ЗРБЧ) на множители – найти операцию обратную умножению, но до сих пор без особого успеха. Числа с разрядностью нескольких сотен пока разложить на множители не удается. 

Известно несколько подходов к решению проблемы (алгоритм Ферма, числовое решето, эллиптические кривые, CFRAC, CLASNO, SQUFOF, Вильямса, Шенкса и др.), которые критикуются и не кажутся перспективными и которые даже не претендуют на универсальность. Автором публикации предлагается оригинальный подход к решению проблемы с претензией на универсальность, т.е. без каких либо ограничений на факторизуемые числа, в частности, ограничений на разрядность чисел.

Появилась уверенность, что по крайней мере читатели domix 32; wataru; Naf2000 понимают, что в моих статьях идет речь о модели, так как вопросы задаются осмысленные.
Здесь важно понимать в рамках какой модели числа разрабатывается алгоритм поиска делителей (сомножителей) заданного составного числа, допущения, ограничения, требования и другие условия модели. Понимать какое влияние они оказывают на характеристики, в частности, на длительность процесса поиска решения.

Известные в настоящее время подходы и алгоритмы не обеспечивают с приемлемыми временными характеристиками получение решения.
В настоящее время ситуация с моделированием чисел и факторизацией как пишут Манин и Панчишкин близка к тупику или уже в тупике.

Читать далее

Как сделать улётную ИТ-конференцию: опыт программного директора CodeFest

1 hour 25 min ago

Всем привет! Меня зовут Денис Яковлев, я Technical Project Manager в Яндексе и программный директор ИТ-конференции CodeFest. В статье расскажу о том, что происходит под капотом подготовки ежегодной конфы на 2,5 тысячи айтишников.

Отвечу на вопросы: зачем я и вся команда в этом участвует, как попасть в программный комитет, как мы собираем программу, сколько заявок на доклад мы получили в этом году, какой был конкурс на один слот. А еще поделюсь тем, как увеличить шанс стать спикером конференции и почему вам отказали в этот раз. 

Читать далее

Kubernetes в продакшене: основные понятия и вопросы на собеседовании

1 hour 29 min ago

В этой статье мы рассмотрим, что такое Kubernetes, в каких случаях его использование оправдано, и разберем вопросы, которые вы можете встретить на собеседованиях.

Читать далее

Как искусственный интеллект допиливал интеграцию 1С и «Битрикс24»

1 hour 44 min ago

На связи Сергей Скирдин, технический директор ИТ-интегратора «Белый код». На майских праздниках, как водится, собрались на шашлыки, за шашлыками много обсуждали искусственный интеллект. В результате получился интересный эксперимент.

Читать далее

«Желтая» энергия: производство зеленого водорода из урины

2 hours 36 sec ago


Самым нужным ресурсом в мире является энергия, получаемая из различных источников и используемая в самых разных отраслях жизни человека. Ископаемые ресурсы, которые и по сей день используются для генерации энергии, обладают рядом недостатков, от негативного влияния на экологию до их неминуемой исчерпаемости. В попытках разработать новые источники энергии особое внимание заслуживает «зеленый» водород. Для получения водорода обычно используется окисление воды, но вот электроокисление мочевины может стать куда более энергетически выгодным вариантом. Проблема в том, что данный метод требует дорогих реагентов мочевины, а кинетика реакции крайне медленная. Потому ученые из Аделаидского университета (Австралия) разработали новую систему, использующую обыкновенную мочу в качестве сырья. Как именно работает данная система, и насколько она эффективна? Ответы на эти вопросы мы найдем в докладе ученых. Читать дальше →

Этот крошечный винт отвечает за будущее гуманоидных роботов

2 hours 1 min ago

Революция в области гуманоидной робототехники уже на пороге. Экспериментальные модели работают плечом к плечу с людьми на разных фабриках по всему миру, а разработчики ИИ создают новые фундаментальные архитектуры, чтобы роботы могли ориентироваться в пространстве так же, как человек.

Но каким бы ни был умным «мозг» такого робота, без «скелета» ему никуда. А этот скелет состоит из множества механических компонентов. Кроме подшипников, моторов и шестерёнок, в каждом гуманоиде должны стоять десятки (лучше — сотни) специальных винтов, которые превращают вращательное движение мотора в поступательное, позволяя пальцам двигаться, а ногам ходить.

Планетарные роликовые винты становятся ключевым (и очень дорогим) элементом следующего поколения роботов. Tesla хвастается новыми дизайнами, Китай спешит взять их производство под контроль, а большинство людей даже не знает, из-за чего весь сыр-бор. Борьба за выпуск улучшенных версий таких винтов может стать новой «гонкой чипов» текущего века. Кто создаст лучший винт — тот и будет контролировать следующих «терминаторов».

Читать далее

Доступ к приватным методам класса в С++

2 hours 4 min ago

В C++ инкапсуляция — один из ключевых принципов ООП, и приватные (private) члены класса защищены от прямого доступа извне. Однако иногда возникают ситуации, когда такой доступ необходим (например, при тестировании, сериализации или отладке). Обычно для этого используют friend-функции или геттеры/сеттеры, но есть и более экзотический способ — использование шаблонов и указателей на члены класса.

В этой статье мы разберём, как можно получить доступ к приватным полям, не нарушая строгих правил компилятора напрямую, но используя особенности инстанцирования шаблонов.

Читать далее

Как мы внедряем ALD Pro: подробный обзор решения, кейсы и лайфхаки для крупных ИТ-инфраструктур

2 hours 16 min ago

Службы каталогов играют важную роль в ИТ-инфраструктуре любой организации. Каждая компания использует службу каталогов по-своему, отсюда возникает необходимость в ее адаптации под уникальные условия эксплуатации. В этой статье рассмотрим программный комплекс ALD Pro от «Группы Астра» — как встроенные возможности, так и примеры его кастомизации под требования заказчиков.  

Читать далее

Домашняя серверная для DevOps: установка GitLab + Let's Encrypt

2 hours 19 min ago

Привет! Это Александр, DevOps инженер команд Страхования в Банки.ру. Продолжаю серию статей про домашний сервер. В прошлых материалах я рассказал о выборе железа, сборке и настройке NAS и серверов для дома. В этой и последующих статьях опишу установку нужного софта в домашнюю серверную. Для этого вам, возможно, понадобится VPN на виртуальных машинах или на уровне всей домашней сети (у меня второй вариант).

Начать я бы хотел с установки GitLab. На данный момент у меня достаточно ресурсов, чтобы хостить GitLab и другие сервисы, которые использует DevOps-инженер. Но для чего мне нужен GitLab? Тут всё очень просто: в своей работе я использую подход Infrastructure as Code (IaC) — инфраструктура как код. При таком методе конфигурация инфраструктуры описана в файлах в репозитории, который хранит историю изменений.

В итоге из хранилища можно как развернуть нужный софт за считаные минуты, так и вспомнить,  что мы коммитили в репозиторий. GitLab требованиям этого подхода отвечает. К тому же у платформы широкий функционал, который понадобится мне в будущем (CI/CD, например, или хранение terrafrom state в самом GitLab).

Читать далее

Автоматизация трехуровневой квартиры: хочу лучше, чем в Дубае

2 hours 19 min ago

Вдохновившись умным отелем в Дубае, молодая пара решила сделать себе квартиру не хуже. Выкупили два верхних этажа в новостройке, а затем террасу на крыше.

Из всего этого получился трехуровневый пентхаус — с двумя террасами, вторым светом, потолками под семь метров и желанием хозяев сделать «умным» все, что можно.

Проект занял полтора года, но результат стоил того. Умный дом управляет светом, климатом, шторами и даже маркизами на террасе. В статье расскажем о трехуровневой квартире и ее автоматизации.

Читать далее

Как быстро проверить скилы Go-разработчика: пул задач для собеседований и одна фаворитка

2 hours 19 min ago

Привет, Хабр! Я Никита Иванов, техлид команды «Видео» в KION. В ИТ я уже девять лет, а последние пять работаю с Go. Сегодня расскажу, какую задачу считаю идеальной для собеседования на позицию Go-разработчика. Этот текст — переработка моего доклада с митапа МТС True Tech Go, видеоверсию можно посмотреть тут.

Программисты знают, что технические интервью редко бывают простыми. Составить задачу, которая честно проверяет реальные скилы, а не сводит все к банальному FizzBuzz, — отдельное искусство. Ниже поделюсь своим подходом к формулировке таких задач, расскажу о реальном кейсе, нюансах подбора и критериях оценки, которые действительно работают на практике. Думаю, этот текст будет полезен техлидам и менеджерам, а еще разработчикам, которые собираются на собеседование.

Читать далее

[Перевод] Хардкорный соло-SaaS: 19 правил выживания

2 hours 19 min ago

Что работает, а что — нет, если вы строите SaaS-платформу в одиночку, без внешних инвестиций и команды маркетинга.

Это выжимка из 4 лет опыта запуска и роста OnlineOrNot — от первых экспериментов до устойчивого бизнеса. Без воды, только то, что реально пригодилось.

Читать далее

Как научить ИИ обслуживать клиентов не хуже человека?

2 hours 19 min ago

Новость о мощи ChatGPT прогремела уже более двух лет назад, однако крупные компании ещё до сих пор полностью не автоматизировали поддержку клиентов. В этой статье разберём на пальцах, какие данные и надстройки нужны для больших языковых моделей, как сделать так, чтобы внедрение было экономически целесообразным и, наконец, что делать с чат-ботами прошлого поколения.

Читать далее

Who's online

There are currently 0 users and 1 guest online.