每日最新情感日志速递平台 第一时间了解互联网的新鲜句子。
当前位置:主页 > 贝多芬 >

OpenAI CTO Greg Brockman都调侃说:“六个月前我也想不到我们会

发布时间:2019-05-02 06:39 类别:贝多芬

  为了让模子更好地节制乐曲主体内容的布局,OpenAI为模子设想了多种分歧的嵌入。除了一般的位置嵌入之外,他们额外让模子进修一个嵌入,用它来追踪每个样本中曾经颠末的时间。如许,所有同时响起的音符城市具有同样的时间嵌入。他们还为和弦中的每个音符添加了一个嵌入(这种做法雷同于相对留意力,当模子需要生成第四个音符的时候它会供给第三个音符作为参考,也就让模子更容易进修)。最初,他们还添加了两种分歧的布局嵌入,它们的配合感化是告诉模子某一段音乐在更大的曲目范畴内的位置;此中,第一个嵌入会把大段音乐分为128个部门,第二个嵌入会从127到0倒数,暗示距离结尾还有多远。

  用Lady Gaga曲风续写贝多芬的《致爱丽丝》,来自OpenAI手艺博客

  直播的配角是OpenAI新缔造的作曲AI“MuseNet”,它能够创作分歧气概的、时长达4分钟的乐曲,气概能够按照分歧的作曲者变化(巴赫、贝多芬、Oscar Peterson、Frank Sinatra、Bon Jovi)、分歧的气概变化(Jazz、Albeniz、片子配乐、村落、印度宝莱坞、迪士尼),并且乐曲中能够利用 10 种分歧的乐器。“MuseNet”利用的是和前段时间 OpenAI 的文本生成模子 GPT-2 雷同的大规模 Transformer 模子,并且为了加强它的长序列建模能力,“MuseNet”也利用了稀少留意力手艺。继前次用 GPT-2 生成接近人类水准的短文之后,OpenAI 仿佛曾经成为了长序列建模的小妙手。

  OpenAI前几日俄然在Twitch展开直播。此前,OpenAI的每次DOTA2直播都是在这里进行的,但此次的内容不再是电子游戏了,而是直播AI创作的曲子。OpenAI CTO Greg Brockman都讥讽说:“六个月前我也想不到我们会把直播频道的分类从DOTA2换成音乐和表演”。

  进修音乐终究是一件有难度的使命,分歧的乐器有分歧的音色,分歧的曲风也有各自的微布局。所以OpenAI的做法是让模子进修并预测MIDI (音符、节制参数等构成的数字音频信号,能够用MIDI播放器播放),而不是进修原始音频波形;同时OpenAI也为模子设想了对应作曲者和乐器的token,简化数据参数。

  在稀少Transformer的从头计较以及优化过的焦点协助下,MuseNet被设想为一个72层、具有24个留意力头的收集,它能够在4096个元素长度的内容长进行完整的留意力操作。正由于它可以或许处置的序列足够长,所以它能够记住曲子中的长段布局,完成段落的反复以及变化。

  这项研究其实是活泼风趣,OpenAI也但愿大师多多参与勾当,多多会商和反馈,也协助他们选定这项研究的下一步方针。公开参与的时间不断持续到5月12日!

  在OpenAI的研究人员们看来,音乐生成使命的难度介于文本和图像之间,它具有和文本雷同的矫捷的序列布局(好比图像中能够固定地参照前N个元素,而文本和音乐中的这个数字大小是不固定的)。他们收集了锻炼数据集并测验考试了分歧的锻炼技巧。

  模子的结果是惊人的,不只当天的Twitch直播中演示的分歧气概的曲目辨识度高、旋律天然,并且OpenAI在引见博客中展现的混搭生成成果(从某首出名乐曲中取一个末节作为开首,然 http://djrichb.com/beiduofen/630/


上一篇:夏光宇博士自幼学习笛箫

下一篇:没有了

你可能喜欢的