Habr.com

Syndicate content Хабр
Updated: 30 sec ago

Обработка русского языка на Java

Sun, 09/19/2021 - 19:45

Рассказ пойдет об одной новой, общедоступной Java/Kotlin библиотеке, для работы с русским языком. Она позволяет получить исходные формы + морфологическую информацию для большинства слов русского языка. Статья предназначена для тех, кто создает ботов, обрабатывает сообщения и занимается поиском. Для справки, ключевое отличие лемматизации от стеммизации (урезания до нормализованной формы) состоит в том, что лемма удовлятворяет правилам языка, например для слова "яблоками" леммой будет "яблоко", а не просто урезанный корень. Лемма может быть и более сложной, например для слова люди, начальная форма – человек. В этой статье мы рассмотрим способ быстрого извлечения такой информации из морфологического словаря.

Запустить процесс

И продолжается «вечеринка со свинцом (Pb)»…

Sun, 09/19/2021 - 19:31
По мотивам серии заметок в канале LAB-66...
Посвящается всем гражданским активистам, которые боролись и борются со свинцовым загрязнением своих городов

Недавно один из постоянных читателей поинтересовался каким-таким образом ему выделить максимальное количество свинца из аккумулятора от бесперебойника. Этот же читатель сетовал, что из 15 кг свинцового аккумулятора от автомобиля получилось выплавить «на костре» всего лишь килограмм свинца, а хотелось бы больше.

Признаюсь честно, такой вопрос меня привел в ступор, так как последний раз с подобным видом самодеятельной металлургии я встречался в далеком детстве. Но статья не про выплавку кастетов, грузил и солдатиков с помощью подручных материалов, статья про «взрослый» тяжелый металл, от отравлений которым страдает порядка 800 млн человек во всем мире. Добро пожаловать на «свинцовую вечеринку», которая продолжается и будет продолжатся на детских площадках, школах, садах и больницах еще долго… За подробностями — под кат.


Welcome в мистерии Сатурна!

Разработка контроллера резервного питания. Технология отладки и тюнинг

Sun, 09/19/2021 - 19:05

В продолжение разработки рассмотрим технологию отладки платы контроллера и его программного обеспечения . Попробуем адаптер SWD, осциллограф, VT100 терминал через UART, движок FreeMaster, экспорт и анализ в MATLAB. Пройдём через ужас тюнинга. Всё на примере открытого демо-проекта управляемого источника напряжения на базе платы контроллера.

Читать далее

Профсоюзный дайджест. Цифровое подавление, бригады “удоленщиков”, 10 суток ареста, зарплатный железный занавес, IT 90-е

Sun, 09/19/2021 - 19:00

Syn ack, Хабр!

Эта неделя выдалась очень горячей: массовые блокировки, арест председателя профсоюза курьер, попытки удаления постов о работодателях (и моих в том числе), возвращение эпохи 90-х в айти бизнесе, железный занавес для сотрудников компаний. Во всех этих случаях становится ясно - каждый сотрудник рискует остаться один на один с корпорацией и государством если им что-то не понравится, пока сотрудники не начнут объединяться в коллективы

Пожалуй, лучше агитации за объединение сотрудников в профсоюзы и не придумаешь (позицию команды Навального не поддерживаю)

Читать далее

[Перевод] Знакомимся с аудио платой Bluetrum AB32VG1 RISC-V Bluetooth через RT-Thread

Sun, 09/19/2021 - 19:00

Bluetrum AB32VG1 – это макетная плата на базе микроконтроллера AB5301A RISC-V, спроектированного как под приложения с использованием Bluetooth-аудио, так и для общих проектов, которые работают с операционной системой реального времени RT-Thread.

Эту плату мне прислали разработчики RT-Thread, и далее я опишу свой опыт первого знакомства с ней. В ходе этого небольшого эксперимента я опробую RT-Thread Studio IDE, помигаю светодиодом и поработаю с примером кода для аудио интерфейса, так как для Bluetooth пока примеров нет… Читать дальше →

Тест примечательной акустики: два экспертных материала о «полочниках» и «напольниках» от Arslab и Triangle

Sun, 09/19/2021 - 15:20

На прошлой неделе мы представили обзоры заметной аудиотехники — поговорили о крупных полочниках Debut Reference DBR62 и Carina BS243.4 от ELAC, наушниках Yamaha HPH-MT8 и Klipsch T5 II True Wireless Sport McLaren Edition. Сегодня продолжаем рассматривать интересные колонки и рассказываем об интересной полочной акустике Triangle AIO Twin и напольниках Arslab Stereo Two.

Читать далее

Компиляция без предупреждений — что случилось в Linux-сообществе

Sun, 09/19/2021 - 15:08

Пару недель назад Линус Торвальдс активировал флаг -Werror для всех сборок ядра. Мнения сообщества касательно этого решения разделились. Против даже высказался разработчик фронтенда Clang и фреймворка LLVM. Обсуждаем ситуацию.

Читать далее

[Перевод] В чём разница между Debian и Ubuntu? Что лучше выбрать?

Sun, 09/19/2021 - 15:00
Поговорим о Debian и Ubuntu. И там, и там можно использовать команды apt-get для управления приложениями. Оба дистрибутива поддерживают установку DEB-пакетов. Часто, читая статьи про Linux, можно видеть, что для Debian и Ubuntu подходят одни и те же инструкции по установке каких-то программ.

Чем же, при такой близости друг к другу, различаются эти дистрибутивы?


Для начала надо сказать, что Debian и Ubuntu принадлежат одном и тому же семейству Linux-дистрибутивов. А именно — Debian — это исходный дистрибутив, созданный в 1993 году Иэном Мёрдоком. А дистрибутив Ubuntu, основанный на Debian, создал в 2004 году Марк Шаттлворт.
Читать дальше →

Как я проходила очередное собеседование и не прошла

Sun, 09/19/2021 - 14:38

Привет! Меня зовут Саша, и я хочу стать хорошим системным аналитиком.

Учиться и получать опыт у специалистов - это лучше, чем просто интуитивно выполнять университетские задания, далекие от реальной жизни. Поэтому было очень круто уже на втором курсе поучаствовать в программе отбора по этому направлению, и я очень благодарна, что у меня была возможность проверить свои знания на реальных кейсах.

Читать далее

Новое в управлении iOS и macOS, WWDC 2021

Sun, 09/19/2021 - 14:00

В преддверии продаж новых iPhone 13 и iPad с iOS 15 хотим поделиться своими впечатлениями о новшествах в управлении яблочными девайсами.

На прошедшей WWDC-2021 Apple сделали несколько докладов об использовании iOS и macOS для работы. Обзорный доклад доступен по ссылке. Далее под катом расскажем о нём и остальных докладах подробнее.

Читать дальше

Кросс компиляция пакета для роутера на примере Qbittorrent

Sun, 09/19/2021 - 06:45

Добрый день друзья. Как-то мне захотелось установить Qbittorrent на мой роутер который оснащен OpenWRT. Конечно создатели OpenWRT уже предусмотрели возможность сборки кастомных покетов об этом можно почитать вот тут: https://habr.com/ru/company/ruvds/blog/530984/ . Но данный способ очень долгий, приходится скачивать исходники OpenWRT, компилировать тулчайн и прочее. И я подумал а почему-бы просто не скачать тулчайн и собрать проек обычным образом под катом мой опыт.

Читать далее

[Перевод] ИИ в качестве тренера: советы и мотивационные беседы для чемпионов

Sun, 09/19/2021 - 05:17


Компания SportsBettingDime в партнерстве с OpenAI работает над спортивным проектом с привлечением технологий искусственного интеллекта. Цель проекта — создание цифрового спортивного тренера, который способен мотивировать команду или же давать полезные советы, которые помогают вырвать победу у противника. В перспективе наработки проекта планируется использовать для бизнеса.

Проект базируется на GPT-3, это уже третье поколение алгоритма обработки языка от OpenAI. В прошлом году GPT-3 наиболее масштабной и продвинутой языковой моделью в мире. К сожалению, она может работать лишь для решения задач на английском языке. Ну а о подробностях проекта — под катом.
Читать дальше →

Q-Q Plots. От чайника до профессионала за один гайд

Sun, 09/19/2021 - 04:52

Как понять, что выборка данных принадлежит определенному распределению? Есть 2 метода: аналитический тест Колмогорова-Смирнова (тест Шапиро-Уилка для нормального) и графический метод при помощи графика квантиль-квантиль плот.

Чем так замечателен второй вариант? Он позволяет делать выводы, не основываясь на таких спорных показателях как.

Графический метод является мощнейшим инструментом анализа, но как сказано в англоязычной статье википедии про Q-Q Plots, требует серьезных навыков для интерпретации. В данной статье я представляю дорожную карту пути к пониманию квантильных графиков.

Читать далее

Про многопоточность 2. GCD

Sun, 09/19/2021 - 03:41

Привет! Вот и новая часть серии статей про многопоточность дождалась своей очереди (ну вы поняли, да, типа очередь статей последовательная (͡° ͜ʖ ͡°) ). В этот раз мы поднимемся на ступеньку выше, рассмотрим фреймфорк Dispatch, разберем большую часть GCD примитивов, распространенные проблемы и поищем решения.

Читать далее

ВМС США убирает в дальний ящик создание Railgun

Sun, 09/19/2021 - 01:18


Любой, кто играл в Quake, знает о рельсотроне (railgun). Термин рельсотрон был предложен в конце 1950-х годов советским академиком Львом Арцимовичем для замены существовавшего громоздкого названия «электродинамический ускоритель массы». Лев Арцимович, мировой специалист в области термоядерной физики и физики высокотемпературной плазмы. Изобретённый им ускоритель плазмы был выдвинут на Нобелевскую премию, но СССР снял кандидатуру учёного с обсуждения из-за секретности разработки.

Причиной разработки рельсотронов, являющихся перспективным оружием, стало то, что, по оценкам экспертов, использование порохов для стрельбы достигло своего предела — скорость выпущенного с их помощью заряда ограничена 2,5 км/сек. В 2005 году ВМС США запустили программу по разработке рельсовых орудий под названием Velocitas Eradico. Согласно Popular Mechanics, ВМС США потратили 500 миллионов долларов, чтобы попытаться создать настоящий рейлган, «использующий электричество и магнетизм вместо пороха и химической энергии для ускорения снаряда по паре рельсов». Но теперь разработчики явно сдались:
Это оружие стало жертвой изменения курса ВМФ на более быстрое и дальнобойное оружие, способное поражать корабли и наземные цели в крупной войне. США обладают самым большим военным бюджетом в мире. На 2022 год Пентагону собираются выделить рекордную сумму – свыше $750 млрд. Бюджетный запрос ВМФ не включает финансирование рельсотрона.
Читать дальше →

Kotlin Native. Работаем с новой моделью памяти

Sat, 09/18/2021 - 23:20

Всем доброго дня! С вами Анна Жаркова, ведущий мобильный разработчик компании Usetech. Продолжаем рассматривать способы многопоточный работы в Kotlin Native. В предыдущих статьях мы уже рассмотрели существующие способы работы с многопоточностью с корутинами и без, и что делать с имеющимися болями. Теперь поговорим о новой модели управления памятью, которая появилась совсем недавно.

31 августа компания JetBrains представили превью новой модели управления памятью в Kotlin Native. Основной упор команда разработчиков сделала на безопасность шаринга между потоками, устранение утечек памяти и освобождение нас от использования специальных аннотаций. Также доработка коснулась Coroutines, и теперь можно без опаски переключаться между контекстами корутин без заморозки. Обновления подхватили и Ktor:  

Итак, что же нового появится в версии Kotlin 1.6.0-M1-139: 
1. Заявлено, что мы можем убрать все freeze() блоки (в том числе и во всех фоновых Worker), и переключаться между контекстами и потоками без каких-либо проблем. 

2.Использование AtomicReference или FreezableAtomicReference не приводит к утечкам памяти.

3.При работе с глобальными константами не нужно теперь использовать SharedImmutable.

4.При работе с Worker.execute producer больше не требует возвращать изолированный подграф объектов. 

Однако есть и нюансы:

Читать далее

[Перевод] Таким может быть ИИ для Warhammer 40k

Sat, 09/18/2021 - 22:49

Вы хотели бы оттачивать мастерство, пробовать новые стратегии в настольной версии Warhammer, играя против ИИ? Программист и фанат Warhammer начинает обучать ИИ для девятого издания этой игры.

Пока у нас стартует курс по Machine Learning и Deep Learning, приглашаем посмотреть на общий план проекта и рассуждения разработчика.

Читать далее

Работа с очень длинными числами на C++

Sat, 09/18/2021 - 19:56

Недавно я решил написать свою собственную реализацию длинной арифметики для C++. Делал просто для себя, ибо эта тема мне кажется довольно интересной. Поставил перед собой следующие задачи:

Читать далее

Разговор тестировщиков среднего возраста об индустрии тестирования 21 века

Sat, 09/18/2021 - 17:00

20-25 лет назад у профессии тестировщика на территории постсоветского пространства не было престижа от слова совсем. Тестировщиками брали тех, кого называли «уверенными пользователями компьютеров». В какой-то момент они были подобны «менеджерам по уборке помещений» — прибраться за разработчиками, рассказать, что вот тут они букву потеряли. Представления о качестве, процессах и разработке развивалось очень медленно.

Со временем такое отношение сильно изменилось, и сейчас хороших, грамотных специалистов в тестировании расхватывают просто мгновенно. Но одновременно это повысило требования к ним. Прошли те времена, когда тестирование было лёгкой точкой входа в IT. Сейчас начинающему тестировщику нужно преодолеть технический барьер и многое изучить, чтобы войти в профессию. При всём этом, все еще нет единой системы обучения тестированию.

Об этом я и хочу сегодня поговорить.

Читать далее

Почему и как Индия стала глобальным IT-гигантом?

Sat, 09/18/2021 - 15:00

В начале 2020-х годов всё чаще говорят о превращении Индии в глобальный IT-хаб и «индийском информационном чуде».

Глобальные информационные компании вроде Facebook, Google, Amazon вместе с американскими и арабскими инвестиционными фондами выстраиваются в очередь, чтобы вкладываться в индийскую информационную сферу и развивать сотрудничестве с индийскими IT-корпорациями – такими, как Jio Platforms. Трое из четырёх айтишников на мировом рынке – индийцы. Город Бангалор, где производится 38% IT-экспорта Индии, в ближайшие годы может обойти Сан-Франциско с его Кремниевой долиной в качестве важнейшего мирового центра информационных технологий. Читать дальше →

Who's online

There are currently 1 user and 1 guest online.