
Новостей об искусственном интеллекте гораздо больше, чем кто-либо может уследить. Но вы можете оставаться в курсе самых интересных событий в этой колонке, в которой собраны достижения в области ИИ и машинного обучения со всего мира и объясняется, почему они могут быть важны для технологий, стартапов или цивилизации. Примечание: способы применения машинного обучения в искусстве, которые находят исследователи, всегда интересны, хотя и не всегда практичны. Команда из Вашингтонского университета хотела посмотреть, может ли система компьютерного зрения научиться распознавать то, что играет на пианино, просто глядя на клавиши и руки игрока сверху.
Audeo, система, обученная Эли Шлизерманом. Кун Су и Сюлун Лю смотрят видео игры на пианино и сначала извлекают простую последовательность нажатий клавиш, напоминающую пианино. Затем он добавляет выразительность в виде длины и силы нажатия и, наконец, полирует его для ввода в синтезатор MIDI для вывода. Результаты немного расплывчаты, но определенно узнаваемы.

Изображение предоставлено: Shlizerman, et. al
«Раньше считалось невозможным создавать музыку, которая звучит так, как будто ее можно сыграть в музыкальном представлении», – сказал Шлизерман. «Алгоритм должен определить реплики или« особенности »в видеокадрах, которые связаны с созданием музыки, и он должен« представить »звук, который происходит между видеокадрами. Это требует системы, которая одновременно является точной и творческой. Тот факт, что мы создали музыку, которая звучала довольно хорошо, стал сюрпризом ».
Еще одно из области искусства и литературы – это чрезвычайно увлекательное исследование вычислительного развертывания древних букв, слишком сложных для обработки. Команда Массачусетского технологического института изучала «запертые» буквы 17-го века, которые настолько замысловато сложены и запечатаны, что их удаление и расплющивание могло привести к необратимым повреждениям. Их подход заключался в рентгеновском сканировании букв и установке нового усовершенствованного алгоритма для работы с расшифровкой полученных изображений.

Диаграмма, показывающая рентгеновские снимки буквы и то, как она анализируется, чтобы виртуально развернуть ее. Изображение предоставлено: MIT
«В итоге алгоритм выполняет впечатляющую работу по разделению слоев бумаги, несмотря на их чрезвычайную тонкость и крошечные промежутки между ними, иногда меньшие, чем разрешение. сканирования », – сказал Эрик Демейн из Массачусетского технологического института. «Мы не были уверены, что это возможно». Работа может быть применима ко многим видам документов, которые трудно распутать простыми рентгеновскими методами. Относить это к категории «машинное обучение» немного натянуто, но это было слишком интересно, чтобы не включать его. Полный текст статьи можно найти на сайте Nature Communications.

Изображение предоставлено: Asensio, et. al
Вы приезжаете на пункт зарядки вашего электромобиля и обнаруживаете, что он не работает. Вы даже можете оставить плохой отзыв в Интернете. Фактически, существуют тысячи таких обзоров, которые представляют собой потенциально очень полезную карту для муниципалитетов, стремящихся расширить инфраструктуру электромобилей.
Омар Асенсио из Технологического института Джорджии обучил модель обработки естественного языка на таких обзорах, и вскоре он стал экспертом в их анализе. тысячи и выжимая понимание, например, где простои были обычным явлением, сравнительная стоимость и другие факторы.