Habr.com

Syndicate content Хабр
Все публикации подряд на Хабре
Updated: 1 hour 54 min ago

Разбираемся с Apache Spark

Wed, 04/17/2024 - 23:38

В сегодняшней статье мы начнем знакомиться с универсальной и высокопроизводительной кластерной вычислительной платформой Apache Spark, научимся разворачивать данное решение и выполнять простейшие программы. При обработке больших объемов данных скорость играет важную роль, так как именно скорость позволяет работать в интерактивном режиме, не тратя минуты или часы на ожидание. Spark в этом плане имеет серьезное преимущество, обеспечивая высокую скорость, благодаря способности выполнять вычисления в памяти.

Читать далее

Определение жанра фильма по описанию

Wed, 04/17/2024 - 23:20

В ходе поиска темы проектной работы, которой должен был завершиться курс Machine Learning. Professional, я решил поэкспериментировать с данными о фильмах, мультфильмах, сериалах и прочей схожей продукции. Немного сожалея, что времени смотреть кинопродукцию у меня почти нет, приступим.

Читать далее

Дерево отрезков

Wed, 04/17/2024 - 21:57

Всем привет. В этой статье я расскажу про дерево отрезков. Очень мощной структуры данных, которая позволяет делать много разных операций над массивом чисел. Я постараюсь по полочкам разложить эту тему и объяснить возможности дерева отрезков. Также я разберу несколько нетривиальных задач на дерево отрезков. Помимо самого дерева отрезков я расскажу и про связанные темы: дерево Фенвика и разреженные таблицы.

Читать далее

[Перевод] Как извлечь пользу из повседневных рабочих конфликтов

Wed, 04/17/2024 - 21:17


Однажды президент одной крупной организации привлёк внешнего консультанта для урегулирования конфликта между двумя вице-президентами. Отношения между ними испортились настолько, что они общались только через сообщения, почту и посредников. В начале сессии оба вице-президента отказывались даже смотреть друг на друга. Со временем они начали понимать, как их действия влияют друг на друга, и стали искать новые способы взаимодействия — и тогда их внешняя враждебность уступила место более тесному сотрудничеству. К концу сессии вице-президенты разговаривали и даже смеялись вместе. Однако, хотя поначалу все были довольны результатом, результаты вмешательства оказались недолговечными: уже через месяц вице-президенты возобновили свою борьбу за влияние — в ущерб компании в целом. Читать далее

Делаю игрулю на Playdate на чистом C. Глава 3

Wed, 04/17/2024 - 20:45

Глава 1

Глава 2

Я пишу игру на игровую консоль Playdate на чистом C. Игра в жанре "выживальщик" наподобие Vampire Survivors. Так как в чистом C отсутствуют многие современные объектно-ориентированные удобства мне приходится по-всякому изворачиваться чтобы адаптировать свои идеи в код. В этих заметках ты узнаешь из первых уст как создаётся игруля с нуля от идеи до публикации.

В прошлой главе я описал как инициализирую сцену, как очищаю ресурсы, показал как заполняю сцену реквизитом и даже поэкспериментировал с генерацией этого самого реквизита. В этой главе я расскажу как работает самая важная функция GameUpdate, в частности, обработка ввода и процессинг данных.

GameUpdate это функция-колбэк, которая вызывается каждый тик. А значит её задача это реализовать святую троицу любой игры:

Читать далее

Знай, куда идёшь: 1С как кузница карьеры

Wed, 04/17/2024 - 19:19

Годы идут, рынок меняется. Если ещё пару лет назад российский рекрутмент встречал новые волны джунов с горящими глазами, готовых бороться за место в стартапах, то сейчас мы всё чаще сталкиваемся с тем, что компании выходят на поиски – и, как ни странно, получают совсем немного качественных откликов.

В этой статье мы поговорим с Дмитрием Олейником, руководителем стажировки программистов 1С, о том, как новичку стать востребованным, а компаниям найти толковых специалистов.

Читать далее

Не только HDD: ёмкость SD-карт тоже растёт. SanDisk анонсировала 4 Тб карты памяти, и это не предел

Wed, 04/17/2024 - 19:05

Как обычные пользователи, так и корпорации нуждаются в носителях информации всё большего объёма. И чем портативнее такой девайс, тем лучше, за некоторыми исключениями. Раз есть спрос, то и предложение тоже в наличии. Так, компания SanDisk разработала карту памяти формата SD объёмом в 4 Тб. Правда, продаваться она начнёт не ранее 2025 года. Увеличиваются объёмы и других носителей, включая жёсткие диски. Подробности — под катом.

Читать далее

SPARK для «малышей»

Wed, 04/17/2024 - 18:57

Примеры кода на Python для работы с Apache Spark для «самых маленьких» (и немного «картинок»).

Данная статья представляет собой обзор основных функций Apache Spark и рассматривает способы их применения в реальных задачах обработки данных. Apache Spark — это мощная и гибкая система для обработки больших объёмов данных, предлагающая широкий спектр возможностей для аналитики и машинного обучения. В нашем обзоре мы сфокусируемся на ключевых функциях чтения, обработки и сохранения данных, демонстрируя примеры кода, которые помогут новичкам быстро включиться в работу и начать использовать эти возможности в своих проектах.

Читать далее

Kodein DI для Android. Целостность графа и тесты на DI

Wed, 04/17/2024 - 18:51

DI фреймворки бывают двух видов: те, что строят свой граф зависимостей во время компиляции (compile time фреймворки), и те, которые делают это уже при выполнении кода (runtime фреймворки).

Kodein — типичный представитель runtime фреймворков. Это значит, что о пропущенной зависимости вы узнаете непосредственно в процессе работы приложения, что может стать неприятным сюрпризом. Только представьте себе: вы пропустили на регрессе какой-то кейс, и у вас краш в продакшене из-за DI! Это же настоящий кошмар!

Однако отказываться от Kodein ID и других runtime фреймворков не стоит. О том, почему мы продолжаем ими пользоваться, и как их сделать более надёжными, я расскажу в третьей статье из цикла материалов про Kodein DI для Android.

Погнали.

Читать далее

Обнаружение аномальных звуков сердцебиения на основе записей сердечного ритма

Wed, 04/17/2024 - 18:30

Всем привет! Сегодня рассмотрим задачу обнаружения аномалий тонов сердца, используя аудиозаписи звуков сердцебиения. Для этого будем использовать библиотеку librosa по работе с аудиофайлами, а также классические алгоритмы машинного обучения и методы глубокого обучения.

Возьмем датасет “Heartbeat Sound”, который содержит аудиофрагменты сердечных ритмов различной продолжительности от 1 до 30 секунд, как здоровых пациентов, так и имеющих аномальные звуки сердцебиения. Набор содержит 813 аудиофайл с записями, разбитыми по категориям: artefact, extrastole, murmur, normal и unlabel. Попробуем разобраться, что обозначают эти категории.

Normal - как и следует из названия, нормальное сильное ритмичное сердцебиение.

Murmur - записи звука сердца, где присутствуем какой-то шум, например, свист, рев, урчание. Наличие такого шума может быть симптомом многих заболеваний сердца.

Etrastole  - экстрасистолические (дополнительные) записи  звука, которые могут появляться время от времени и могут быть идентифицированы по отсутствию сердечного тона, включающему дополнительные или пропущенные сердечные сокращения. Экстрасистола может не быть признаком заболевания, но в некоторых ситуациях могут быть вызваны заболеваниями сердца.

Artefact - по сути не является сердцебиением, и характеризуется широким спектром различных звуков.. В этой категории содержится широкий спектр различных звуков, включая визги, эхо, речь, музыку. Обычно различимые тоны сердца отсутствуют, важно определять эту категорию записей, чтобы можно было повторить исследование.

Читать далее

SSD killer

Wed, 04/17/2024 - 18:15

SSD killer — destroyer for your ssd

Привет, меня зовут Ваня, и вот коротенькая история о том, как я придумал и собрал одну штуку, и почему вам нужно срочно отдать мне все свои деньги.

А если серьезно, это устройство для оперативного аппаратного уничтожения данных вместе с носителем. По своей сути это аналог чеховского ружья, у которого цель выстрелить в нужный момент.

SSD killer

Китай не принимает платежи из России. Где заказать печатные платы в Китае в 2024 году

Wed, 04/17/2024 - 18:14

Полгода назад я писал, как решал проблему с ушедшими JLCPCB. И вот с марта возникла новая проблема ахахах (истерический смех) —  китайские банки начали блокировать оплату от российских компаний за компоненты для сборки электроники. Оплаты не проходят даже у тех компаний, которые заключили долгосрочные контракты с китайскими производственными площадками.

Из-за этого увеличились сроки, а также ряд компаний начал работать через посредников, что сильно увеличило цену на поставку электронных компонентов.

Я порезал свой первый обзор + добавил несколько новых компаний, которые сейчас напрямую поставляют компоненты и печатные платы из Китая. В конце - сводная таблица с итогами.

Читать далее

[Перевод] Анатомия Hello World на языке C

Wed, 04/17/2024 - 18:00

Эта статья посвящена программе Hello World, написанной на C. Это максимальный уровень, на который можно добраться с языком высокого уровня, не беспокоясь при этом о том, что конкретно язык делает в интерпретаторе/компиляторе/JIT перед выполнением программы.

Изначально я хотел написать статью так, чтобы она была понятна любому, умеющему кодить, но теперь думаю, что читателю полезно иметь хотя бы некоторые знания по C или ассемблеру.
Читать дальше →

Долгая дорога к дому: как вода очищается на пути из скважины в частный коттедж

Wed, 04/17/2024 - 17:28

О том, как очищается вода на пути в частные квартиры, на Хабре писали уже довольно много. Эта вода приходит в водопровод уже частично очищенной местным поставщиком. А потом дополнительно фильтруется системами фильтрации на вход, стоящими в квартире, — и становится питьевой. 

В частном доме чистую воду получить сложнее — придя из скважины, она не очистится простым фильтром-кувшином или трехступенчатой конструкцией под раковиной. Подготовкой воды придется заниматься самостоятельно, иначе даже для бытовых нужд, вроде стирки, она будет непригодна.

Мы в БАРЬЕР много лет изучаем этот путь воды и стараемся его облегчить, совершенствуя собственные системы фильтрации для коттеджей. Под катом мы проследим путь воды из скважины к потребителю в частном доме на примере нашей коттеджной системы очистки, покажем состав воды из скважины до и после фильтрации, и подробно расскажем про каждый этап. 

Пройти путь воды

Недоступный металл для ветрогенераторов: краткая история диспрозия

Wed, 04/17/2024 - 17:13

Мы продолжаем рассказывать о различных металлах, истории их открытия, применении и патентом аспекте. На этот раз речь пойдет о серебристо-сером металле диспрозии (Dysprosium, от греч. δυσπρόσιτος, то есть «недоступный»), химическом элементе III группы периодической системы, относящимся к лантаноидам, иначе называемым редкоземельными металлами (РЗМ). Природный диспрозий состоит из семи стабильных нуклидов массой 164 (28,3%), 162 (25,5%), 163 (24,9%), 161 (18,9%), 160 (2,33%), 158 (0,10%) и 156 (0,06%). Известно 29 радиоактивных изотопов диспрозия, атомные массы  варьируются от 138 до 173 а. е.

Читать далее

Разговор с Дмитрием Одинцовым из «Труконф» об интеллектуальном шумодаве в ВКС, дипфейках и голографических конференциях

Wed, 04/17/2024 - 17:05

Информационная служба Хабра побывала на конференции «Демодень». Мероприятие было посвящено презентации результатов и целей российского разработчика ВКС‑решений «Труконф». На конференции мне удалось поговорить с директором по развитию компании «Труконф» Дмитрием Одинцовым. Наш разговор был об использовании ИИ и нейросетей в ВКС, голографической коробке, представленной компанией в феврале 2024 года, дипфейках и о том, насколько удобны Apple Vision Pro для использования в видеосвязи. Приятного чтения!

Читать далее

Как мы применили нейросеть Stable Diffusion в создании контента для интернет-магазина

Wed, 04/17/2024 - 16:51

Что делать, если то самое классное изображение никак не удается найти, а у заказчика пока нет ресурса предоставить нужный контент? Что можно придумать для разделов каталога, когда есть только фото для продуктовых карточек, чтобы это выглядело красиво? Как при этом не забыть о метафорах и ассоциациях бренда и создать необходимое настроение на сайте? Да еще и чтобы заказчик все это согласовал без правок…

Читать далее

Как выбрать правильный сервер c подходящими для ваших нейросетей CPU/GPU

Wed, 04/17/2024 - 15:08

С развитием генеративного искусственного интеллекта (ИИ) и расширением сфер его применения создание серверов с искусственным интеллектом стало критически важным для различных секторов — от автопрома до медицины, а также для образовательных и государственных учреждений.

Эта статья рассказывает о наиболее важных компонентах, которые влияют на выбор сервера для искусственного интеллекта, — о центральном и графическом процессорах (CPU и GPU). Выбор подходящих процессоров и графических карт позволит запустить суперкомпьютерную платформу и значительно ускорить вычисления, связанные с искусственным интеллектом на выделенном или виртуальном (VPS) сервере.

Читать далее

[Перевод] Пересаживаем проект с Vagrant + VirtualBox на Docker-контейнеры с помощью Ansible

Wed, 04/17/2024 - 15:06

До того, как все заполонили контейнеры, главными инструментами для создания локальной среды разработки были технологии наподобие Vagrant и VirtualBox. Эти инструменты в сочетании с такими средствами автоматизации, как Ansible и Chef, позволяли создать рабочую воспроизводимую среду для приложений. Однако развитие легких вариантов виртуализации, заложенное docker и постоянно упрощаемое различными облачными инновациями, привело к упадку этих некогда очень популярных среди разработчиков инструментов. Настолько стремительному, что увидев их где-нибудь, мы невольно задумываемся о возрасте кодовой базы.

И вот недавно я сам наткнулся на них. А если быть точнее, то мне достался проект, который все-еще на них полагается — он предполагает установку виртуальной машины VirtualBox под управлением Debian, созданной с помощью Vagrant, а затем настроенной с помощью Ansible. И все это работает. Ну, по большей части. Но когда не работает, разбираться, что пошло не так — настоящая боль. Поддержание координации между Vagrant и VirtualBox было особенно неприятной черной магией, которая подтолкнула меня к размышлениям о более дешевых и дружественных альтернативах виртуализации.

Читать далее

Мышиные гнёзда: какие разъёмы использовались в компьютерных устройствах?

Wed, 04/17/2024 - 14:59

Думаю, большинство читателей Хабра подключают свою мышку к компьютеру или ноутбуку через USB‑разъём. Наверняка есть и те, кто не хочет переходить с привычного PS/2. Кстати, в геймерской среде бытует мнение, что интерфейс PS/2 позволяет более эффективно действовать мышкой в некоторых играх. Так что такой разъём по-прежнему востребован.

А какие ещё разъёмы использовались? Давайте вспомним.

Читать далее

Who's online

There are currently 0 users and 2 guests online.