Знакомая ситуация: вам скидывают PDF на полсотни страниц, а нужна всего одна цифра. Вы открываете файл, начинаете листать - и через полчаса ловите себя на мысли, что уже забыли, что именно искали. А потом выясняется, что документ - скан. Текст не выделяется, Ctrl+F бесполезен, дедлайн горит. Знакомо?
Ещё пару лет назад выход был один: делать скриншоты кусков, тащить их в онлайн-распознавалки, собирать текст по частям и надеяться, что ничего не потерялось. Сейчас за нас это умеют делать нейросети - причём бесплатно. Они читают сканы, понимают таблицы и вытаскивают нужное из любого хаоса форматов.
В этой статье мы взяли пять таких инструментов и устроили им один и тот же тест: дали инструкцию к пылесосу и попросили объяснить, как почистить фильтр. Посмотрим, кто справится быстрее и точнее.
Поехали!
Читать далееСлабые пароли — головная боль и для пользователей, и для разработчиков. Первые считают, что «кто будет меня взламывать», вторые уверены: «я не банк, кому нужна моя база». А в это время ботнеты методично перебирают комбинации, словарные атаки становятся умнее, а нейросети уже научились генерировать пароли по шаблонам, которые мы считали сложными — но результаты пока не впечатляют.
В этой статье я разберу аутентификацию с самого начала: почему пароли до сих пор актуальны, как оценить их реальную стойкость (с честными расчётами), что происходит с паролем на сервере и какие ошибки допускают разработчики. В конце — чек-лист для обеих аудиторий.
Копнём поглубже?Привет, Хабр.
Мне по работе часто приходится заниматься переводом, и чтобы упростить себе жизнь, я решил настроить себе помощника, который был бы знаком с контекстом моей работы. Ниже делюсь результатами своих экспериментов.
Переводчик в своей работе ориентируется не просто на какой-то язык, а на терминологию и стилистику определённого сообщества. Мой основной рабочий процесс выстроен в Obsidian (подробнее об этом я писал вместе с Игнатием Сатирским), и я подумал, что база знаний, которая накопилась на этой платформе, может послужить «отражением» терминологии и стилистики, на которые мог бы опираться помощник. Я стал искать плагин, который давал бы интеграцию с нейросетью, и из всех возможных вариантов наиболее зрелым мне показался Obsidian Copilot — о нём и пойдёт речь.
Я не рассчитываю, что нейросеть сможет произвести чистовой текст, который сразу можно было бы сдавать как выполненную работу. Но я надеюсь, что получится облегчить мне труд при редактировании. Посмотрим, оправдает ли инструмент мои надежды.
Хранилище с использованными плагинами и результатами экспериментов доступно здесь.
Читать далееАвтомобили перестали быть просто средством передвижения. Автопилот и встроенные ИИ-системы превращают машину в вычислительную платформу. Она обрабатывает гигантские потоки данных в реальном времени, принимает решения без человека и учится на ходу. И чем «умнее» транспорт, тем более сложные задачи он решает.
Недавно глава Micron Санджай Мехротра отметил, что для машин с автономностью четвертого уровня (по классификации SAE (Society of Automotive Engineers, Общества автомобильных инженеров) это практически беспилотные автомобили, управляющие без водителя, но только в строго определенных условиях) не хватит десятков гигабайт — потребуется 300 и больше. Давайте посмотрим, почему.
Читать далееClickhouse. CPU под нагрузкой, память на пределе, диск нагружен. Запросы тормозят. Расчёты не завершаются. Сервер на грани. Что же делать?
Читать далееМошенники адаптировались к ограничениям работы мессенджеров. С февраля пользователям многочисленных мессенджеров, включая MAX, Telegram и WhatsApp (принадлежит экстремистской организации Meta, запрещённой на территории РФ) всё чаще приходят сообщения от ранее взломанных контактов. В посланиях эмоциональный текст, ссылки на каналы в Telegram или вредоносные сайты. Потенциальную жертву активно убеждают установить приложение на телефон, ведь только так она сможет увидеть фотографии и видео, опознать знакомых.
После установки приложения, которое на самом деле является вредоносным, телефон оказывается под контролем злоумышленников. Они получают доступ к приложениям для дальнейшего распространения ВПО и пытаются вывести все доступные средства со счетов жертвы.
По смыслу это та же схема «Мамонт», но с учётом новых реалий.
Разберём, что поменялось, по шагам и расскажем, почему это всё ещё работает. Приведём рекомендации, как усложнить жизнь злоумышленникам. Ну и в конце — инструкция, что делать, если рекомендации не сработали.
Читать далееНаписали текст на 10000 знаков, все ключи вставлены, title прописан, картинки сжаты. Публикация – и тишина. Страница болтается где-то на третьей странице выдачи, трафика ноль. Знакомо? В моей практике 8 из 10 таких случаев объясняются одной и той же причиной: контент не совпал с тем, чего на самом деле хотел человек, набравший запрос. Это и есть промах мимо интента поискового запроса – намерения, с которым пользователь приходит в Яндекс или Google.
Разберём, что такое интент, как определить его до написания текста и как измерить эффективность контента после публикации.
С цифрами, инструментами и промптами для нейросетей.
Наверное, каждый видел эти терминалы «Сбера» на кассах магазинов. Раньше там был радостный кот, а сейчас бегают разноцветные глаза. И не знаю, как вам, а мне всегда было интересно, что эти девайсы имеют под капотом. Можно ли туда поставить свои приложения? Неужели «Сбер» сам их сделал? Да и было бы забавно заставить работать игры на нём.
И вот он в моих руках, а далее в статье есть все ответы на вопросы выше. Ну и ещё мы с него звонить будем.
Читать далееКогда вы ищете работу, кажется, что вы просто участвуете в процессе: смотрите вакансии, откликаетесь, проходите собеседования.
Но если посмотреть на это как на систему, становится заметно: вокруг кандидата уже сформировалась целая экономика.
В процессе поиска работы возникает экосистема сервисов, каждый из которых решает свою задачу — и при этом зарабатывает по-своему.
Попробуем разобраться, как это устроено.
Читать далееНейросеть конспектов из видео, фото и текста. Узнай, как бесплатно сделать конспект урока или лекции по ссылке на YouTube, получить выжимку и таймкоды, разобраться в теме. Экономь часы на подготовке к занятиям!
Читать далееАвтоматизация клиентского сервиса в медицине — это всегда баланс между точностью данных и скоростью ответа. Рассказываем, как мы создавали для фармацевтической компании «Буарон» умного помощника на базе Yandex Cloud Agent, который обеспечивает круглосуточную обработку запросов и использует связку PHP и WordPress.
Есть два фактора, которые гарантированно дают большую нагрузку на службу поддержки портала – это сложный продукт и широкий ассортимент. Фармацевтическая компания «Буарон» объединила оба. «Буарон» (Boiron) – один из мировых лидеров в производстве лекарств на основе природных субстанций, который в России представляет 130 гомеопатических монопрепаратов и 10 комплексных лекарств. База знаний включает в себя не только описания отдельных средств, но и комплексные решения, такие как «ЛОР-протокол», что требует от ИИ-ассистента высокой точности при сопоставлении запроса пользователя с нужным разделом.
Портал компании заключает в себе огромный объем информации, в которой посетителю непросто ориентироваться. В год пользователи оставляют на сайте более 300 000 запросов – это больше 800 в сутки, при этом ответы не всегда находились, а часть обращений терялась или требовала личного участия специалистов.
Перед нами в QSOFT стояла задача автоматизировать обработку пользовательских запросов на сайте о клинической гомеопатии, снизить нагрузку на специалистов и сократить число пропущенных обращений. Для этого было решено создать умного помощника на базе Yandex Cloud Agent.
Читать далееПредыстория
В октябре был в путешествии, за пару месяц до, наша компания как и многие компании в РФ стали переходить на свои мессенджеры в замен Telegram. У нас выбор пал на Mattermost, ну это такой, аналог Slack. За период примерно 3 месяца я столкнулся с максимально ужасным UI по моему мнению. Нет, проработка его очень отличная. Но вот трудности в самом представлении для пользователей — ужас.
Читать далееИтак, продолжу рассказ о том, как в один прекрасный день, оказавшись на задворках блокировок мессенджеров, я решил создать свой собственный. Изначально проект задумывался как простое средство коммуникации с родными и партнерами по бизнесу. Но вот во что это вылилось спустя всего 4 месяца... Ранее писал о том как всё это начиналось [тут] и [тут]
Аудитория и первые стресс-тесты
На текущий момент у мессенджера уже появилась своя постоянная аудитория, причем многие из этих людей мне совершенно незнакомы! Регистрации идут каждый день, что дает отличный фидбэк, но вместе с тем устраивает настоящий стресс-тест для систем.
Большое внимание пришлось уделить группам. Изначально они были задуманы максимально примитивно, но с ростом числа пользователей и пониманием их потребностей фокус сместился на серьезную доработку групповых чатов:
Читать далееМартовские анонсы показывают, куда движется AI‑инфраструктура: NVIDIA выпускает новые чипы, хранилища и оркестрацию под agentic AI, стартап с $2 млрд дохода использует китайскую базу под видом «frontier», а SambaNova обещает GPU‑убийцу. Разбираемся, что ждет мир нейросетей в ближайшие годы.
Извлечь инсайтыПривет всем, кто заглянул на Хабр за чем-нибудь полезным под кофе
Устраивайтесь поудобнее — сегодня поговорим про ту самую работу, где в тикете пишут «Не работает принтер», без логов и деталей, а со стороны бизнеса уже «горит» и нужно «ещё вчера». Но вместо забегов по магазину — открываешь Kyocera NetViewer, подключаешься к устройствам и начинаешь разбираться, не вставая со стула.
В этой статье — мой взгляд на удалённую первую линию в ритейле через призму Kyocera NetViewer: как честно закрывать заявки, опираясь на статус устройства, сетевую доступность, события и базовые проверки, а не на марш-броски к каждому принтеру.
Разберём:
• что проверять в NetViewer в первую очередь (онлайн/оффлайн, ошибки, счётчики, состояние расходников);
• как по статусам понять, проблема на стороне устройства, сети или клиента;
• в каких случаях достаточно удалённых действий (перезапуск очереди, проверка подключения, базовая диагностика);
• и где проходит та самая граница, когда уже пора идти к принтеру, который жуёт бумагу и подозрительно пахнет гарью. Без занудной теории — только живой кейс, практические шаги диагностики через Kyocera NetViewer, немного самоиронии и мысли о том, как сделать так, чтобы уставал не ты, а только spooler
Нука-нука, что там у тебя...При сборке Java приложения в нативный образ требуются настройки для работы рефлексии, прокси и других динамических механизмов Java. Зачем, если JVM справлялась с этим сама? Разбираем отличия между миром статической компиляции и динамической Java.
Читать далееВсем привет! Меня зовут Саша, я тимлид в DWH MAGNIT OMNI — бизнес-группе ритейлера «Магнит», которая отвечает за развитие омниканального опыта для клиентов.
Недавно ребята из Datalens проводили вебинар в честь выпуска Public API, в котором я принял участие. Эта статья — развернутая версия моего доклада об интеграции Datalens с OpenMetadata.
Читать далееПеревод статьи The New York Times.
По мере того как генеративный ИИ становится все более совершенным, компании и стартапы предлагают решения для верификации контента. Журналисты NY Times протестировали ведущие инструменты детекции — от программ для профессионалов до встроенных функций в смартфоны — и выяснили, насколько им можно доверять.
Читать далееЯ периодически провожу технические интервью и смотрю pet-проекты кандидатов.
И почти всегда вижу одну и ту же картину:
Используется localStorage или заглушки вроде jsonplaceholder.
Я прекрасно понимаю, почему так происходит:
Читать далееПривет, Хабр! На связи Лера, технический писатель в Авито. Сегодня хочется поделиться обзором на книгу «Модельное мышление» Скотта Пейджа.
Эта книга о том, почему для понимания мира нам недостаточно одной красивой идеи, как разные модели помогают объяснять поведение людей, продуктов, рынков и технологий.
Книгу ещё и просто любопытно читать: по пути автор вспоминает множество теорий, историй, экспериментов и исследований из экономики, социологии и теории игр. В первых главах Скотт Пейдж довольно настойчиво убеждает читателя в главной идее книги — мыслить моделями. Он показывает, что сложные явления почти никогда нельзя объяснить одной причиной или одним фреймворком.
Читать далее