Princeton Undergrad创造了Google Deep Dream-Inspired Deepjazz A.I.音乐制作者

$config[ads_kvadrat] not found

Deep Dream

Deep Dream
Anonim

4月的第一个周末,金智星花了很多时间用咖啡因和电脑编码,因为他开发了深度学习音乐发生器deepjazz。这位20岁的普林斯顿大学计算机科学二年级学生在4月1日至3日在大学举行的第一次黑客马戏团HackPrinceton中,只有36个小时的时间完成了深喉谜。完成马拉松编码后,他创建了一个deepjazz网站,并在GitHub上发布了源代码。

但令Kim感到惊讶的是,节目开始了。 Deepjazz在Python和GitHub上的稳步发展趋势 - 达到GitHub上排名第七的整体计划。它甚至出现在HackerNews的头版上,并且仍在进行热烈的讨论。

“我从未预料到我的第一方项目会在人气方面成为爆炸性的,”金说 逆。 “这真是太疯狂和有趣了。”

deepjazz - 使用Keras和Theano进行深度学习驱动的爵士乐! http://t.co/G5wscglzO7 #python

- Python趋势(@pythontrending)2016年4月11日

在吃饭,睡觉和完成其他课程之间,Kim认为他花了大约12个小时来开发deepjazz的源代码。然而,他早在HackPrinceton之前提出了人工智能音乐发生器的想法。在芝加哥大学暑期实习期间,他遇到了Google的Deep Dream,这是一种照片生成器,可以解释图像中的图案并将其转换为其认识的其他对象。结果是看起来像是疯狂梦想的不稳定的图像。

“使用深度学习来解释艺术的想法对我来说真的很有意思,”金说。 “谷歌推出和发布的这种深度梦想框架非常吸引人,因为你正在用现有的艺术品创作新颖的艺术品。”

Deepjazz使用机器学习来制作爵士音乐 - “A.I.为使爵士乐成为“SoundCloud简介”而制作的。 Kim没有参加音乐理论课,但已经演奏了七年的单簧管,因为它的非传统旋律选择了爵士音乐。 A.I.系统的音乐,“可能有一些不寻常的输出,所以我认为爵士乐特别适合在飞行中产生音乐的想法,”他说。

他重新调整了他的朋友Evan Chow开发的爵士音乐优化的现有音乐发生器,称为JazzML,使用该代码获取相关数据,但将其转换为与两个深度学习库Keras和Theano兼容的二进制矩阵。

Kim描述了deepjazz框架本身是一个双层LSTM,它是一种人工神经网络架构。在学习了音符的初始基线种子序列之后(Kim使用了Pat Metheny的“And Then I Knew”部分),它将音符分配给音符并根据这些概率生成下一个音符。例如,如果你给程序提供刻度A,B,C,则下一个注释deepjazz生成的概率很可能是D,Kim解释说。

从历史上看,评论家们说,人工智能音乐发生器一直受到制作听起来太机器人和无菌的歌曲的困扰 - 缺乏人类组成的音乐所听到的颜色。杰弗里比尔梅斯是一位前麻省理工学院的学生,他在1993年撰写了关于重现音乐节奏的计算机论文 逆 十一月:

“当你学习演奏音乐而你正在学习爵士音乐时,有一种实用工具可以直观地理解音乐是什么使它成为人类,”Bilmes说。 “人类是直觉的,人类往往无法描述他们如何做人类的事情。当时我觉得我可能在为计算机程序定义这些东西时违反了神圣的誓言。“

当Kim正在为deepjazz做研究时,他遇到了许多系统,这些系统产生了听起来像机器人的音乐。

“音乐和艺术是我们认为非常人性化的东西,”金说。 “为了使它听起来更人性化,更逼真,它真的很难分类。”Kim建议发电机可以通过对它们进行编程来创造听起来更人性化的歌曲,听起来与原始音轨不太相似。

其他开发人员已联系Kim并有兴趣扩展deepjazz,以便更多人可以与之互动。有一天,Kim可以看到有一天成为一个即兴合作伙伴,可以人为地为音乐家提供一个回溯。更进一步,他可以看到应用程序可以为您喜爱的曲目创建新的,类似的声音音乐,或者可以为音乐家提供新的和弦和进步。

Kim承认自己还远未成为深度学习方面的专家,但他在实习和普林斯顿大学开展深度训练和培训的经验使他对该领域有了一些宝贵的见解。

“A.I.再也不再是科幻梦想了。这是非常真实的事情,而且正在以非常快的速度接近,“金说。 “希望看到这位大学生,甚至还不是高年级学生,能够在黑客马拉松中做出一些东西,这对于那些正在努力进入计算机科学的学生来说是鼓舞人心的。”

$config[ads_kvadrat] not found