Feed aggregator

Модели LLM их проблема правдоподобных ответов

Habr.com - Fri, 04/10/2026 - 09:15

Добрый день, это моя первая статья на Хабре, прошу не судить.

Я хочу рассказать вам немного о моём исследовании и то как стоит честно относиться к LLM моделям, так как вы скорее всего знаете, что такое LLM модель не будем терять времени на её определение давайте перейдём к сути моей работы: LLM не дают гарантии правильности ответа особенно операций с большим количеством шагов и формальным рассуждением, даже когда ответ правдоподобный или оказывается верный. (Вы же все видели дисклеймер ChatGPT can make mistakes.Check important info)

Начнём с самого начала 4 сентября 2025 года прошло исследование о галлюцинациях в моделях (в котором участвовали инженеры OpenAI), и одно из утверждений было, что даже при наличии безошибочных обучающих данных статистическая целевая функция, минимизируемая в процессе предварительного обучения, приведет к языковой модели, генерирующей ошибки, почему же это так потому, что сама природа LLM моделей вероятностная.

Но так как мы живём в мире где мы внедряем системы LLM повсюду появляется закономерный вопрос как же верифицировать LLM и тут у инженеров есть готовый по их мнению инструментарий, который массово внедряется:

Читать далее

Сегодня мы построим свою локальную модель на смартфоне. С блэкджеком и WebUI

Habr.com - Fri, 04/10/2026 - 08:56

Недавно Apple подтвердила стратегическое партнерство с Google для интеграции ИИ Gemini в свои устройства.  Сегодня мы их опередим и поднимем свою LLM в Android-смартфоне. С блэкджеком и WebUI.

Читать далее

Рефакторил-рефакторил, и почти всё переписал в итоге

Habr.com - Fri, 04/10/2026 - 08:44

Дали мне недавно задачу написать тесты для одной CLI-тулзы. Это мне уже привычно и понимание, зачем тулза нужна, есть. Я только не знал, что меня ждёт в коде. Программист, писавший её, сделал гигантскую работу — претензий нет (не обижайся, пожалуйста, если читаешь это, но это стоит отдельной статьи). Там суммарно, наверно, порядка 30к строк кода написано. Нюанс в том, что, видимо, он раньше не писал на C#,

Так что тут я соберу для вас примеры, как нельзя писать и как стоит.

Читать далее

Разработка BI-аналитики для застройщика в Apache Superset

Habr.com - Fri, 04/10/2026 - 08:02

На старте у клиента уже были дашборды, но они не закрывали текущие задачи бизнеса. Данные находились в разных системах — 1С, Excel, Google Таблицы, XML-выгрузки и внутренняя система.

Клиент принял решение выстроить аналитику заново и выбрал Apache Superset как инструмент визуализации. Сначала собрали единый слой в PostgreSQL, настроили загрузку через Python, привели метрики к одной логике и зафиксировали правила расчётов.

После этого уже собрали дашборды под управленческие задачи клиента. Визуализация строилась так, чтобы быстро находить отклонения и принимать решения, а не просто смотреть отчёты.

В результате у клиента появилась система, где данные считаются одинаково для всех, автоматически обновляются и используются в работе без дополнительных проверок.

Читать далее

Микроразметка Schema.org для интернет-магазина: полная инструкция по внедрению

Habr.com - Fri, 04/10/2026 - 07:06

Два одинаковых товара, одинаковая цена, одинаковая позиция в выдаче. Но у одного сниппета – звёздочки рейтинга, цена, статус «В наличии», а у другого – голый title и серый текст. Кликают на первый. Всегда.

Разница между ними – структурированные данные (machine-readable описание контента страницы по стандарту Schema.org). И если Вы разработчик, который отвечает за e-commerce проект, эта разница – Ваша прямая зона ответственности.

Я Пётр Гришечкин, эксперт в области SEO. Последние 15 лет я проектирую системы кратного роста трафика для крупнейших сайтов. И последнее время пишу всякие околоSEO статьи – https://t.me/seo_and_sem. В этом руководстве – конкретные шаги, рабочий код и грабли, на которые наступают почти все.

Читать далее

QA в CI/CD: как перестать гонять тесты руками и настроить это один раз

Habr.com - Fri, 04/10/2026 - 04:39

Разбираю как выглядит нормальный QA-пайплайн в GitHub Actions: от линтинга до E2E тестов на Playwright. С рабочими конфигами, кэшированием и уведомлениями о падениях.

Читать далее

Как сделать карточки для маркетплейса за 5 минут: нейросеть, которая делает фото товара продающим

Habr.com - Fri, 04/10/2026 - 01:07

Знакомая история - товар хороший. Цена нормальная. Но карточка на Wildberries или Ozon выглядит так, будто её фотографировали на кухне при выключенном свете. Конверсия — ноль. Продаж — нет.

Раньше выход был один: нанять фотографа, арендовать студию, заплатить дизайнеру за обработку. Это время и деньги — от 5 000 до 30 000 рублей за одну позицию. Для малого бизнеса или начинающего селлера — часто неподъёмно.

Теперь есть другой путь.

Читать далее

Анализ ключевых тенденций исследования «Роботы в публичных пространствах» (2025–2026)

Habr.com - Fri, 04/10/2026 - 00:58

В данный момент в России идёт работа по созданию закона о «Робототехнике и беспилотного автономного транспорта», который предположительно появится в 2027 году. Но подобные законы, планируются и в других странах и будет нелишним рассмотреть опыт других стран.

Анализ ключевых тенденций, описанных в исследовании «Robots In Public: Building the Governance Framework for shared Human‑Robot Spaces» (2025–2026 гг.). Отчёт основан на данных экспертного воркшопа в MassRobotics (Бостон), анализа кейсов и международного опыта.

Читать далее

[Перевод] «Вояджер-1» — «капсула времени» 1977 года, работающая на 69 КБ памяти и 8-дорожечном магнитофоне

Habr.com - Fri, 04/10/2026 - 00:40

Прямо сейчас, на расстоянии более 24 миллиардов км от Земли, 48-летний космический аппарат мчится через межзвёздное пространство со скоростью 61 000 км/ч. Это самый удалённый от Земли объект, созданный человеком. Он передаёт научные данные, которые не может собрать ни один другой существующий прибор. И он делает всё это, имея в распоряжении всего 69 килобайт памяти и 8-дорожечный магнитофон.

У телефона в вашем кармане примерно в миллион раз больше памяти, чем у компьютера, управляющего «Вояджером-1». Одна фотография с низким разрешением, сделанная на том же телефоне, содержит больше данных, чем вся бортовая память «Вояджера-1».

И тем не менее он здесь, по-прежнему функционирует, по-прежнему передаёт данные, по-прежнему делает открытия в области космоса, куда ни один космический аппарат никогда не добирался, спустя почти полвека после того, как он покинул Землю в рамках миссии, изначально рассчитанной на пять лет.

«Вояджер-1» — это, по любым меркам, самая невероятная история успеха в истории человеческого освоения космоса.

Читать далее

Я просканировал 30 публичных MCP-серверов: почти половина не дошла даже до скоринга

Habr.com - Fri, 04/10/2026 - 00:31

Мы привыкли винить LLM‑агентов в галлюцинациях, бесконечных циклах и слитых бюджетах на API. Но что, если проблема в инфраструктуре, которую мы им скармливаем? Я написал детерминированный CI‑сканер для оценки качества MCP‑серверов и прогнал через него 30 публичных пакетов. Результат оказался интересным: почти половина серверов убивает агента ещё до старта, а официальные инструменты дают ИИ гранату в руки. Под катом - хардкорный разбор костылей экосистемы, графики и Open Source инструмент, который защитит ваш продакшен.

Читать далее

Как я превратил Codex в персонального Джарвиса

Habr.com - Thu, 04/09/2026 - 23:56

Можно ли превратить coding agent не просто в помощника по коду, а в персонального ассистента с долговременной памятью? Я собрал для Codex иерархическую базу знаний на Markdown и Git, добавил роли, автоматизации, AnkiConnect и Telegram-архивы, а затем проверил, насколько далеко можно зайти без векторных баз и сложного RAG. В статье показываю, как устроена такая система, где она реально полезна и почему главный вопрос здесь не в модели, а в архитектуре памяти.

Читать далее

Критерии выживания и случайность — 3

Habr.com - Thu, 04/09/2026 - 23:39

Продолжаем data mining путешествие в погоне за удачей. Сегодня разберем как устроены жизненные факторы. Эти категория достаточно скучна, но статистически хорошо подтверждена. И интуитивно понятна большинству людей. Но влияние ее очень сильное. Поэтому рассмотрим ее подробнее.

Читать далее

REST API: гайд по проектированию от принципов до боевых кейсов

Habr.com - Thu, 04/09/2026 - 23:12

Проектируете REST API и всё ещё используете 200 OK для ошибок?

А знаете, почему неправильные статус-коды могут убить производительность и как всего один кейс с TSB Bank показал цену плохого анализа?

В этой статье разбираем реальные принципы REST, модель зрелости Ричардсона.Полезно всем, кто пишет бэкенд или проектирует микросервисы.

Читать далее

[Перевод] Почему Claude Cowork — это то, чем ChatGPT должен был стать, но не стал

Habr.com - Thu, 04/09/2026 - 23:10

Claude Cowork превращает часы работы в минуты. ChatGPT так не умеет.

Я работаю с Claude Cowork с первого дня его появления.

Это потрясающий инструмент для автоматизации рутинных компьютерных задач.

Вот чем Claude Cowork принципиально отличается от ChatGPT:

У него есть прямой доступ к вашим локальным файлам — а значит, он может мгновенно браться за любую задачу (при правильной настройке)

Он берёт на себя многошаговые задачи и выполняет их автономно

Он создаёт профессиональные документы — Excel, PowerPoint, Word

К нему можно подключать плагины для специализированной работы: продажи, юридическая сфера, финансы, продуктивность

Работа с ChatGPT — это как сидеть в пузыре чата. Бесконечные уточнения туда-сюда, потому что он понятия не имеет, что вы на самом деле пытаетесь сделать.

Claude Cowork устроен иначе.

Его контекст — это папка и файлы, к которым вы даёте ему доступ.

Вы указываете на папку, формулируете задачу → Cowork составляет план и выполняет сам.

К концу этой статьи вы узнаете:

Как пользоваться Claude Cowork

Как экономить часы работы с Cowork (то, чего ChatGPT не умеет)

Как сделать Cowork ещё мощнее с помощью плагинов и коннекторов

Читать далее

TAPe‑дневник, день 8: сегментация по границам, 77% классификации и первые бенчмарки против YOLO

Habr.com - Thu, 04/09/2026 - 22:55

В этом посте продолжаем дневник TAPe‑детекции на COCO: добавляем сегментацию по контрастным патчам на границе объектов, дорабатываем классификацию, избавляемся от learning rate и смотрим, как ведёт себя YOLO на нашем маленьком датасете.

А уже завтра покажем базовые и COCO‑бенчмарки, сравнения с YOLO и RF‑DETR по точности (mAP50/mAP50‑95), скорости, числу параметров и требованиям к данным, а заодно чуть подробнее поговорим про аннотацию и то, почему нам хватает десятков изображений на класс там, где другим нужны сотни тысяч.

Вникнуть

Почему «избалованность» — главный KPI воспитания детей. Вы точно этого не знали

Habr.com - Thu, 04/09/2026 - 22:54

Многие инвесторы боятся, что капитал превратит их наследников в избалованных мажоров.

Мы пашем годами, чтобы обеспечить их будущее, а потом с ужасом смотрим, как они не ценят нашу заботу.

Но что, если я скажу, что их «избалованность» — и есть ваш главный KPI?

Наши предки умирали от простуды, чтобы мы могли ворчать в очередях аптек.

Почему «везунчики», которые пользуются вашим трудом, — это не ошибка системы, а её истинная цель.

Как перестать винить молодежь в лени и понять настоящий смысл своего богатства.

Ответы в новой статье Моргана Хаузела. Морган — один из лучших авторов, пишущих на тему финансовой грамотности на английском языке. Я сделал для вас перевод.

Читать далее

Создаем комикс с помощью нейросетей: пошаговый разбор

Habr.com - Thu, 04/09/2026 - 22:20

Вы когда-нибудь хотели нарисовать комикс, но упирались в то, что не умеете рисовать? Руки помнят только школьные каракули на полях тетради, а персонажи в голове так и остаются в голове.

Сейчас это перестало быть проблемой. Нейросети для генерации изображений стали полноценным рабочим инструментом. Они не заменят художника полностью, но помогут сделать законченный комикс за вечер вместо месяца. Да, с кривыми пальцами иногда, с ошибками в перспективе, но живой и ваш.

В этой статье я покажу пошагово:
- как выбрать нейросеть для комикса;
- как сделать так, чтобы персонаж не менял лицо в каждом кадре;
- как добавить облака с текстом и не сойти с ума;
- и, конечно, на какие кнопки нажимать.

Работать я буду в BotHub - это агрегатор нейросетей. Если вам надоело прыгать по сайтам, постоянно включать и выключать VPN, регистрироваться и разбираться, где какая кнопка, BotHub собирает Midjourney, DALL-E 3, Kandinsky и другие популярные модели в одном интерфейсе. Оплата по факту использования - сколько нагенерировал, столько и заплатил. К тому же сервис дарит 300 000 капсов всем новым пользователям по ссылке, можно затестить прямо сейчас!

Одна просьба перед стартом: не ждите от нейросети идеала с первой попытки. Это не голливудский ИИ.

Поехали, приятного прочтения!

Читать далее

Pretext — библиотека, которая считает текстовую вёрстку в 500 раз быстрее браузера. Зачем это нужно и как работает

Habr.com - Thu, 04/09/2026 - 22:01

28 марта 2026 года инженер Midjourney Cheng Lou выложил в открытый доступ библиотеку, которая за неделю набрала почти 40 тысяч звёзд на GitHub. И имя ей — Pretext. Это движок текстовой верстки на чистом TypeScript, который полностью обходит DOM и браузерный layout рефлоу. За этим стоит вполне большая проблема и красивое решение.

Давайте разберемся, что это такое, зачем оно нужно, как устроено и стоит ли тащить к себе в проект.

Читать далее

Как бы я рассказал про линейную регрессию (если б меня кто-то спросил)

Habr.com - Thu, 04/09/2026 - 21:58

Привет, Хабр! Если вам когда‑либо хотелось разобраться в том как работает линейная регрессия, или хочется освежить в памяти основные моменты без необходимости продираться через разрозненные источники, то прошу под кат. Это не статья «от начинающего для начинающих. Экстра лонгрид — писал больше года. Статья концептуальная, а концептов пять: 1) ключевой повествовательный компонент — визуализации (их около сотни), текст — вспомогательный; 2) анимации везде где только можно (их всего 34); 3) простота — достаточно знаний со школьного курса математики чтобы начать читать; 4) воспроизводимость — подавляющее большинство медиаматериалов сгенерированы при помощи Python а исходный код выложен в open‑source и, самый главный, 5) фокус на практике, — например, если упоминается векторная запись метода наименьших квадратов, значит она в нарративе решает возникшую боль читателя.»

Читать далее

APT 3.2.0 с новым механизмом разрешения зависимостей

Linux.org.ru - Thu, 04/09/2026 - 21:32

Сформирован релиз инструментария управления пакетами APT 3.2.0 (Advanced Package Tool) на основе изменений экспериментальной ветки 3.1. Ожидается, что новая версия будет интегрирована в Debian Unstable и Testing, а также войдёт в состав будущего релиза Debian 14; в Ubuntu 26.04 используется близкая версия 3.1.16.

( читать дальше... )

 , ,

Who's online

There are currently 1 user and 1 guest online.
Syndicate content