人工智能创作是未来？其实未来已来_国内_资讯

人工智能创作是未来？其实未来已来

: 编辑：csm351

2017-08-25

本篇是算法作曲系列文章的第三篇，也是终结篇。看过了算法作曲的过去和现在，我们对它的未来充满了期待，来看看作者他有哪些想法，与你所想有何异同吧。目之所及的未来
比起奇点，一介俗人如我更愿意讨论有生之年切身之事。科技的发展带来了对音乐创意行业的反思，这个行业里的大多数人活在 21 世纪，却依然秉持着手工业时代的生活方式。这和我们获取成就感的方式有关，然而有朝一日，当我们终将从技术中解放出来的时候，我们怎样才能更好地工作，又怎样才能在这本就是仅能养家糊口的行业中立足呢？

1. 教育 1.1 工具
作为更好的思维工具，提升音乐创作教育水平。
现在，通过大量唾手可得的优秀的软件和音乐作品，即可获得诸多经典风格的学习素材和演化逻辑。如果有编程和逆向工程的能力，通过拆解优秀软件的设计思路还能以更快速度地获得学习典型流行音乐的最小模型。
基于现存风格的写作（制作）教学，需要使远距联想可视化，也需要在训练中获得对音乐元素的控制感，通过语音、文字、音符输入对重复片段及其变体进行标记、检索，将加快音乐数据的搜寻和分析。
开发出灵活适配用户现有音乐素材库的多重分类检索程序，可加快浏览、筛选的过程，也可用在查询提示、查询扩展和相关回馈等功能上，进一步提升检索效率，从而在情感化的音乐检索中降低用户的交互疲劳度，节约创作精力。
随着技术发展，在自动作曲中人的介入会越来越少，但却会越来越关键，进一步研究人与计算机分工和协作等问题将是一个重要的方向。同时，算法作曲与人的作曲思维的合作方式也是题中之义。
自适应教育将通过大数据、人工智能和虚拟现实等技术手段，重塑音乐教育，使得新一代个体更为优秀。

1.2 更优秀的听众
近期神经科学研究表明，音乐的演奏、创作、合作与大脑的可塑性有极高相关，早期及持续的音乐训练将有可能逐渐成为教育课程的核心组成部分。这让我联想到一个非常令人印象深刻的实验，使用合适的训练方式，可以让本来无法从镜子中辨认出自己的猴子通过镜子测试。如果我们将通过镜子测试等同于拥有自我意识，那么，不但自我意识的边界是模糊的，而且在一定程度上是可以被训练的。
事实上历史上那些伟大的作曲家，他们的音乐能力也是在先天思维优势上加以后天训练的结果。所以，当我们将在十年到二十年的时间里逐渐转化为纯创意人员的时候，我们依然需要刻苦锻炼自己的感官敏感和音乐技能，以获得宏观和细微调控 AI 辅助下的艺术作品的能力。因为在成熟的技术成为音乐创作的基准线之后，技术上的缺陷将变得更加难以容忍，尤其是对于那些，当代基因技术和教育科学培养起来的，认知结构更加优秀、听觉经验也更丰富的听众。

2. 音乐创作 2.1 EMI 系统带来的思考
EMI/EMILY HOWELL 系统能够捕捉到典型的和声与旋律风格特征，但在音乐的结构力、进行方向、目的性、戏剧张力方面，乐曲越长，缺陷越明显。虽然随着技术发展，程序还有改进空间，比如增加一些规则补丁来进一步优化其表现，但是依然改变不了程序本身设计思路浅层，瓶颈明显的事实。
我们将其原理和侯世达在 1983 年公布的一个用来猜报纸上的乱序字谜的程序 jumbo 相比较能更清楚地了解这一点。 jumbo 基于活细胞体内的反应（当时尚无 DNA 中的基因的概念）模拟自动化的字母组合。不同的字母在不同类型的「酶」的作用下相互结合或者分开，这些酶四处游走，找到对应的结构就附着其上，启动反应发生。有的酶负责重组（「pang-loss」变成「pan-gloss」或「lang-poss」），有的酶负责粘连（「g」和「h」变成「gh」，「jum」和「ble」变成「jumble」），还有的则把现有的拆散（「ight」变成「it」和「gh」）。每个反应的结果都促使新的反应发生，在任意时刻「酶」的数量和种类都会自我平衡，以反映出整个字母组合的状态。
正因如此，这个系统生成的部分作品效果良好，才更值得深思。我们知道，越是趋于底层的技术带来的变革越大，也越能支撑上层系统运作的灵活性，然而越是趋向于本质的东西，也就越难理解和运用。这就好像我们知道要不停地拆解自己的思维过程，来获得更深层的自我认知，但是到一定程度很再拆解，也只能接受，再下去，会陷入无限自指。从机制层面进行开发的算法并不成熟，因而，选取共性写作时期的音乐作品，拆解其具体表象材料，抽取高重复率的标签性质材料单元，再基于特定结构规则对其重组和粘连，这样的技术，可谓一时之选。这种框架无需知道如何创造，却完全源于作曲家独特创造与程序设计者音乐修养、审美态度的紧密联结。
为什么这样会奏效？或者说为什么这种音乐从客观评价上依然会有说服力？至少一个作曲系的学生拿着它去交作业是足够了的，如果有优秀作曲家的介入，其中某些作品走俏市场也并非笑谈。
究其原因，西方音乐形成的共性写作体系中，包含了大量可程序化的符号及其表达逻辑，而这种心智程序，被作为音乐文化传统，内化到了西方作曲家和听众的认知结构中；这其中更有一部分作品，对程序化依赖极高，进行逻辑极为严密，如赋格、十二音整体序列、模块化和标签式的流行音乐等等。这一类程序作为音乐文化系统的宏观模因（包含生理基础和社会文化两个层面上的演化），保证了作曲家的在感知层面（联觉同构、情绪与律动、时空隐喻、文化隐喻等标签性观念）与观众建立一定的共识，而音乐艺术本质上的模糊性、多义性和阐释性，使得计算机或作曲家可仅依托程序性写作完成作品，观众依然可以对其进行认知构建，即依然可以感动、领悟，甚至哪怕只是想象而不是亲历体验，他们仍可如此。神经科学的研究也表明，多种刺激——无论是物质性、听觉性、视觉性、体觉性还是虚拟的想象性刺激信息，都能够经由大脑纹状体多巴胺能系统腹侧纹状体的介导而激发背侧纹状体的多巴胺释放活动及脑电反应，进而导致主体产生多元一体化的快感。
我想之所以侯世达在《如聆巴赫》中悲观感伤，也只是因为音乐是组成他生命的重要部分，他害怕自我建构的意义感和控制感的丧失，害怕成为与机器等同物罢了，作为人，最正常的就是情感上不接受；而作为「层次缠结反馈循环」、「形式系统通过同构进行意义获取」等观念的建构者，他在理性上应该是清醒的。

EMILY HOWELL 还能基于旧风格产生新风格。很多人为此而惊奇，这些人关于灵感的预设是错的。近期以色列 SImone Shamay-Tsoory 教授的研究观点指出，大脑默认模式网络和执行控制网络的协同引发创造。如果你从遗传和演化的角度去观察，人类艺术创造的起点，在于生理系统的共性基础、群体长期共性文化（文化传统）、个体知识结构独特性和个体神经系统的倾向性等。很长一段时期，世界上绝大多数的音乐创作参与者，终其一生都只是借助时代的工具（如前所述，模因包括有形工具与思维工具两方面），在前人的基础上做微弱的探索，他们在这个领域使用最多的思维工具就是在传统音乐形式基础上，对各个变量做润饰和微调，可称谓「完形外冗余码」，其目的是使作品在审美认知共性基础上具备一些新异性刺激，形成「有趣味的形式」。
在这个以创造力和创新为座右铭的时代，艺术工作者更加有勇气去确立自己的边缘属性、去触碰自己领域受众的认知边界，他们对音乐文献使用的方式又增加了传播学的地缘优势、文化差位竞争、风格重组等思维工具。EMILY HOWELL 的新风格生成原理，正是在以人的反馈与规则调试为主导的交互实验中，从音乐构成元素各个层面去对已有风格的音乐重组装配的过程。

2.2 音乐创作的文化系统
在人类并不漫长的音乐历史中，生物快感是主要的诱因。
某些具有音乐属性的音响材料激发人的生物快感，促成进一步的音乐行为；
大脑喜欢新异刺激。音乐行为通过「刺激-重复-习惯化-变化-新刺激」的循环和个体到群体的信息交互，致使个体更新认知结构和音乐行为、特定群体形成一定的音乐文化传统、群体之间的交流形成更大的音乐传统体系和更多的可能性；
新的个体在自身所能接触到的文化系统范围内建立自身的认知结构，并以此为起点继续重复音乐行为循环，致使自身的认知结构进一步演化；
某些个体/群体音乐行为会被文化传统所接受并在长时间维度内影响其演化，其余个体/群体音乐行为也将在一定程度上对宏观音乐传统的演化造成影响，但是这种影响或在大的时间跨度内耗散。
以上基于演化论分析的文化传统筛选机制是难以完全被确知的，一些曾被认为是边缘的音乐文化类型在较短的时间维度内成为主流，进而造成大众的认知结构演变；一些曾被认为是文化系统短时记忆的音乐文化类型正全面参与人类文化系统的演变，而一些基于文化系统长时记忆的实验性质反思作品，其影响力已经在相当短的时间维度内耗散。
进一步的研究表明，音乐行为经验、音乐认知的生理性结构、音乐的文化背景和社会经济基础等一同构成文化系统筛选机制，并且，音乐认知的生理结构在其中占基础地位。这类似于计算传播学针对社会热点的近期研究。
需要强调的是，音乐文化系统极其复杂，与人类社会文化密切关联。这里仅试图呈现简化系统理论。
从具体的音乐类型上对以上论述举例。西方流行音乐创作一直以生物快感作为根本立足点，以上文中「有趣味的形式」为追求目标，其最为先锋的特性均避让了人类最为敏感的生理认知成分（如低音、旋律、节奏、组块化、重复性因素），这些创作者们并没有非常大的意愿面向时间试错。而西方严肃音乐在进行了一系列对传统文化系统的反思实验之后，最终也回到了以人的听觉验证为根本立足点的创作中来，呈现出与流行文化相互渗透的趋势。

2.3 音乐创作的思维工具与音乐认知的生理表征
音乐创作在观念层面上最重要的几个思维工具，我们可以借用行动科学第一序改变与第二序改变的理论探讨。我们将「系统之内的变化」称为「第一序改变」，将「改变系统本⾝」称为「第二序改变」。当然，现实情况会更复杂。
音乐创作「第二序改变」内的重要思维工具包括「重组」与「还原」，两者同时对应着观念和技术层面的加法与减法。「flowmachine」项目就是在这个层面辅助创作的，它以米哈里·齐克森米哈里定义的「心流」概念命名，将音乐元素拆解，一个组件解决一个关键问题，帮助操作者融合已有作品进行并收集自身创作倾向的数据（以前我们写一百首作品可能才意识到自己某方面的风格特质和对音乐元素的使用偏好，现在我们写一首相当于写无数首，收集个人数据更为便捷）。另外，这个系统的意义还不仅如此：绝大部分人的艺术欣赏能力都是高于他的艺术实践能力的，当给你一个自动作曲程序，帮你将历代大师的作品无限重组，由你来调试和反馈，你觉得怎么样？
「第二序改变」内的两个重要思维工具是关于创造观念和文化系统的本质思索。它们可以用「what if machine」的经典问句来表示：
如果我把他的某个做法做到极致，会怎么样？
如果我不按这个传统做，会怎么样？
两者分别代表正向极端和反向思维。这样的例子在音乐史上比比皆是。
基于历史而进行的因果分析效果有限，要解释创造并不容易。音乐创作这个领域最好放在整个人类文明的系统内进行研究，因为，很多伟大的音乐创新正是对曾被认为是无关的、微小的变量做探究才得以产生，而这是随着其他领域的技术发展和社会思潮而来的。
一个世纪之前，格式塔心理学就以朴素的论调探讨经验和行为的整体性，沿用这个理论的研究将音乐在表象层面各个要素随时间的运动逻辑看作是同构于人类生理活动形式的，这个观点富有启发性。其中特别明显的表征元素是节奏。
节奏唤醒大脑对生活中某一类运动形态的识别，节奏也是最直观的与肢体运动视觉形态对应的听觉要素，所谓运动存在，节奏就一定存在。其产生来源于人体内外两个方面，来自外部的是人类社会和自然界的各种音响；来自内部的节奏源泉在多丽丝瀚芙莉（Doris Humphrey，第二代现代舞艺术家）的理论中被划分为四类：
能创造句息的发声器官，带来呼吸、歌唱、语韵节律；
人体功能中的自动化节律形式：心跳、肌肉伸缩、脉动等；
机械性推进系统：人的双腿双手，双腿给予支持，双腿双手在重复交替中带来节拍；
情感的节奏，情感的涨落不仅提供节律的意味，也成为一种判断别人情感节奏的参照系。
从目前西方音乐演变历史和认知科学的研究成果来看，个体听觉能力发展的线索大致是这样的：低频/节奏、线性音高、多声部音高、音色……
这样的规律是极富启示性的：最大限度地保留线性音高和低频/节奏的可感知性，而在多声部音高、音色等更多由文化传统赋予的认知要素上锐意进取。另一方面，关于律制感的研究也引发了新的思考。人类在特定的物理材料震动所发出的声音中，通过直觉（大脑偏好分类记忆）和经验提取其泛音作为音阶组分。我们如果通过编写算法，在乐器组合、乐器个体、整体音响的频率调整上，以泛音分析为部分依据实现动态自动控制，或将对整体音响的听感有重要影响，而在此基础上的创新也将更加符合认知规律。
这里有一个成功例子：美国先锋作曲家艾略特·夏普（Elliott Sharp），有人形容他充分地将毕达哥拉斯「万物可数」的概念表达了出来。在他的手下，无论是混沌理论，斐波纳契数列，核糖核酸（RNA）重组算法，还是几何分形学，都能转化成其音乐作品的组分。而被大多数人所忽略的是，在不少作品中，他用具体可感甚至较为传统的节奏和音色，保证了作品的在听觉上的生理性稳定感。
与此呈鲜明对比的是大量极为混乱的算法作品，这些作品几乎一个不落地使用了人口普查数据、地球经纬度数据、建筑物设计数据、EEG 测量参数等等一切可以找到的「素材」放进以上算法体系中，与音乐基本元素一一对应，「生成作品」。例如：在国内，神经信息教育部重点实验室的专家们于 2009 年率先提出了基于无标度性的脑波音乐编码假说。该假说是基于 EEG 与音乐都遵循「无标度性」这一非线性动力学现象提出的。在脑电方面的研究表明，EEG 的振幅、相位和频率等参数都服从无标度性，EEG 的功率谱也具有无标度性。根据该方法，EEG 的周期与音乐中的音长相对应，EEG 的振幅与音乐中的音高相对应，EEG中的平均能量变化与音乐中的音强相对应。音乐中的音色则可以任意选定，如钢琴。通过以上规则，可以将 EEG 直接实时地转化成音乐。2012 年，神经信息教育部重点实验室卢竞等人进一步使用了与 EEG 同步采集的 fMRI 来对应音乐中的音强，从而制作了 EEG 结合 fMRI 信号的音乐（EEG-fMRI br AI n music）。该音乐比单纯的脑波音乐更符合无标度特性。

于我看来，这种实验鲜有意义。这种试图将跨学科跨层次的参数粗暴对应以发掘「艺术美」的方式，也许有功利因素，但更多的是不理解系统内外各层级的演化规律和普适原则之间的区别，也混淆了两者的逻辑层次。当然，听众依然可以自行建构「意义」，但是这种意义建构本文将不予讨论。

3. 自动作曲的技术发展 3.1
趋势。如果要完全模拟人脑的创作模式，那么自动作曲底层开发的关键在于情感建模，作曲家在构思一个作品的时候会结合很多函数所不能包含的因素，依靠目前的科技水平无法量化，比如文化因素，心理因素等等。就现在业界的发展情况看来，那一天的到来为时尚远。但是，如果参考机器学习和当前深度神经网络的工作方式，几个算法组合集中解决一个问题，不但针对文化因素的建模不算困难，情感建模的技术也能极大提升（考虑到越来越多的实证研究支持「大脑是一个贝叶斯网络」的假设，在这个领域也有越来越多的实质进展，利用贝叶斯优化、全贝叶斯深度学习的技术也即将崛起）。
感性工学与情感计算是目前两大主流研究方向。得益于认知/神经/脑/心理科学及相关技术（如 ERP、人工智能）的飞速进步，或许有朝一日我们可以从可穿戴设备、脑机接口上获取到足够的建模数据，而在近未来，利用可穿戴设备采集数据、利用周期神经网络分析音频等，将具有较高的可行性，让我们拭目以待。（罗素和诺维格在《人工智能——一种现代的方法》中提到：选择这条实用型道路的结果，就是 AI 更像是一个想要爬树到达月球的人，「他能不断进步，直到树的尽头」。）
在已经存在的成果中，对音乐情感表示模型、情感认知模型和情感表达，情感的表现性符号体系等均有不少喜人的进展，这些进展提升了程序进行音乐情感识别、情感驱动的音乐检索、情感音乐图和音乐纹理技术结合的自动作曲等技术的表现。另一方面，基于情感音乐图的实时音乐合成算法，在数字娱乐的情感化配乐中，可以根据当前运动的情感识别结果进行音乐的动态更新，这必然是一个很有应用前景的研究方向。后继研究还包括利用音乐情感识别结果自动生成符合特定情感的场景（包括背景、灯光效果等）以及基于音乐和运动特征匹配的动画自动配乐技术研究等。
3.2
技术发展的瓶颈有可能来自物理、经济，以及社会等多方面因素，这使得预想中的情况要来的更晚些。
首先，针对自动作曲领域，当下并没有投入最顶尖的技术和科研力量，特别是考虑到深度学习在语音识别、自然语言理解、图像识别、自动视觉艺术、围棋等领域的进展。
其次，在相当长的时间维度下，各顶尖的科研机构和公司仍将各自为政，这样的情况导致在自动音乐方面获得巨大进展的公司需要花费更多的时间在基础建模和数据采集上，而无法直接获得顶尖科技公司（如 Google）及产业上下游公司（如 Polyphonic HMI）来自数据与反馈的协助。
再次，音乐媒介的特殊性，使其仅能借鉴其他领域的技术，而无法直接泛化。比如 Google 的 AI 画家 Inceptionism 具有根据视觉线索识别来联想作画，这种技术的基础是两者之间具象的关联，而虽然音乐作品中也存在对听觉表象的捕捉和联想转化，然而这个领域对音响形态的组织逻辑会有更高的要求。
从次，认知/神经/脑科学等领域的进展也会限制这方面技术的发展。事实上，如美国等先进国家已经相继创建了神经音乐学、神经音乐心理学、神经音乐教育学、神经音乐分类学、神经音乐作曲学等运用神经科学研究音乐领域的新兴前沿交叉学科。新生的神经美学领域从研究基本知觉过程起步，探索艺术创造性和艺术成就的神经基础，我们期待它能够揭示艺术的神秘「法则」。
除此之外，商业性计算机辅助作曲技术也迎来了颠覆性的革新，以 samplemodeling 公司为代表的虚拟乐器已经相当成熟，基本解决原生乐器音色建模的难点，这将有可能为电脑自动作曲提供配器方面更进一步的技术支持。而传统采样器与合成器也向精度更高，操作更灵活、体积更庞大的方向发展，它们在功能上有相互渗透的趋势。
最近，著名的科技风投公司 Lux Capital 已经着手投资计算机音频科技领域，这些重要的投资的动向将会在很大程度上重塑商业音乐创作领域。Lux Capital 的意向包括：跨设备和跨环境的环绕/3D/全息的音响投影、沉浸式VR声音体验、虚拟乐器/合成音色、为跨设备、跨平台的消费级应用及游戏等提供更精简易用的音响工程和编码控制等。

4. 行业
4.1
从全球音乐产业分析和中国音乐行业近年的发展概况来看，音乐行业在较长时间内，整体上将继续保持一定的增长；2014 年国内音乐产业在国家文化总市场规模中占 7%，虽然仍高于动漫、网络游戏、演艺市场、电视剧等新兴文化行业，但是需要指出的是，这个数据是囊括整个音乐行业所有核心层、关联层、拓展层细分行业的整体市场规模。拓展层如影视、动漫游戏音乐产业等，与相关产业核心层是叠合的。音乐+互联网、‚音乐+影视游戏动漫等泛娱乐产业链增速最快，是未来发展趋势。
4.2
数字音乐产值因为商业模式、版权规范、社会生活方式等因素获得了较大增长，但这主要以在线演艺为增长来源，与职业音乐创作者收益关联较小；在音乐核心产业内部，创作者的收益呈倒金字塔型，大众付费习惯仍有待进一步培养，国内大部分体制外的职业音乐创作者，仍无法单纯通过数字音乐一次贩卖生存；综艺、影视、游戏、动漫等泛娱乐产业是他们的主要阵地，即便这些新兴行业缺乏行业规范，其音乐衍生产业链的价值亦未得到充分开发，它们仍是对原创音乐需求最旺盛并且最愿意为其付款的行业。

4.3 对配乐行业一些具体问题的思考
在影视、动画和游戏等数字娱乐产品中，针对特定类型的场景、情绪需求而批量创作的背景配乐形式得到了大量的应用。这些配乐被称为罐头音乐，可以采用模式化、模块化程度极高的手法，由人所创作（这种创作手法基本上都采用计算机辅助实现，考虑到商业音乐创作思维模块化的大趋势，早期大量近乎零基础的制作者仰赖这些技术得以进入行业，从业人员普遍受益）。
罐头音乐的使用权可以多次贩卖，其目的是为了满足客户需求：在基本能表达画面的意境，感染观众情绪或渲染气氛的前提下，最大程度地节省成本。须知，为一部影视作品量身定做的配乐，影片的制作方是有一定质量需求的。排除友情和廉价作坊等情况，这些配乐即便因为经费有限，也采取了类似于罐头音乐的创作方式，它的成本也大多高于罐头音乐，因而，罐头音乐就成为大多数影视制作所采用的配乐方案（早期国内版权不规范，对罐头音乐的侵权使用更加泛滥），这其中包括以《大国重器》为代表的众多著名纪录片（欧美、日本公司出品的罐头音乐几乎都拥有相当的音乐质量，从单曲的音乐性、制作质量角度上看，高于目前国内配乐市场上 70% 以上的配乐水准）。实践证明，只要音乐编辑选曲得当、剪辑精良，依然可以做出声画结合非常紧密的影视娱乐作品。虽然这些罐头音乐在配乐统一性、完整性上仍无法跟定制配乐相抗衡。

在国内，影视游戏动漫等泛娱乐产业对本土原创音乐的需求动力主要来源于口碑销售、因语言、货币、互联网政策导致的与国外沟通成本过高等因素（在国外，因为行业竞争激烈的原因，众多职业音乐人也能以相对国内而言有竞争力的价格，提供相当优质的配乐服务），因而一定时期内国内配乐从业人员队伍仍将继续壮大，并在行业逐步规范的同时走向饱和、从业人员需求量萎缩。另外，当前配乐发展的趋势是与声音设计相互渗透，以氛围为主，更多为整体作品服务，而人工智能对音效设计的助益将是极大的：使用更优秀的语言理解、音频分析、情感交互、搜索和分类系统，将符合融合需求的音色从万千素材中识别出来并提供设计方案。更重要的是，如果我们把艺术作为一种本质上属于还原和表现情感和世界的工具，那么声音设计的思想更能与于人类进化早期感官体验相链接，从而使其获得深层情感体验。这或将致使客户在音乐的旋律、独立性层面上降低要求。可想而知，当此类自动作曲与自动配乐技术基本成熟并在价格上拥有更多优势时，将对整个行业有所冲击，这一天终将来临。
依赖于技术含量、客户对音乐的高需求和产业急速发展获得溢价的高端定制配乐行业，也将受到影响，期待通过国内受众对配乐质量的需求标准上升，使得行业继续增加投入的愿望在一定时期内将很难实现。

一种可能：生活方式，听觉经验和需求会在一定程度上限制音乐创作技术的发展速度。
作为社会文化、精神价值和审美情感表征体的音乐，在激发人的复杂情感反应、认知思考和决策行为、引发人脑的复杂生理反应和神经电生理反应方面能够与美术、影视、舞蹈、戏曲等艺术文化当量。然而，我们不可否认的是：1）音乐采用非视觉媒介，看不见摸不着，作为硬需求使人产生长期依赖的能力较弱；2）「听」音乐作为一种生活方式在欧洲也不过数百年，而作为随时随地的生活方式则至今未逾半世纪，相对于那些历史悠久、更为具象而的娱乐方式，太过于年轻；3）把音乐当做一种生活方式、拥有较高的听觉经验均依赖于群体文化传统的建设，特别是乐器演奏基础技能的建设，我国目前的宏观情况是，总体往好的方向发展，然文化心态与技能普及相较于发达国家仍存在一定距离；4）国内卡拉 OK 和电信音乐在建设音乐生活方式上居功至伟，然考虑到上榜歌曲使用的作曲/词技术所指向的受众基数/受教育程度等因素，或难以为尖端音乐技术的发展提供足够动力。
5. 在艺术领域，人工智能将永远无法完全取代人类。 5.1
艺术同时包含着人类原生的欲望本能与意图自我传播与复制的模因，因而，无论有没有强人工智能，人类艺术自娱娱他的功能和自我意义建构将伴随着这个生物群体自始至终。最重要的是，对音乐形式的探究，终有尽头，兜兜转转，一颗本心，仍是人类最珍贵的。
5.2
即使 AI 取代了整个音乐创作行当，也需要人类告诉它前行的方向，而更直接的方式是，人类在生物快感和经验反思的基础上，利用 AI 不断寻找新的变量，发掘新的变量的使用，因为并不清楚哪些变量在未来得以用创新的方式使用并适配人类审美，也无法穷尽音乐听觉与视觉艺术、语言、触觉、味觉及其他符号系统之间的微妙链接关系，所以这种探索将永无止境。
5.3
在出现自我意识的强人工智能之前，人类将成为第一个超人工智能。作为必然的趋势， AI 将作为我们思维和记忆的外延，这些新的「器官」和人类对自身的基因改造技术，将改变我们看待世界的方式。彼时，音乐的形式倒是有可能迎来类似「寒武爆发」式的跃进。

结语
正如英国的洛夫莱斯（Ada Lovelace）在翻译巴贝奇（她的丈夫/第一台可编程机械计算机的设计者）的论文时加上的脚注所言：「……制造有编程和记忆功能的机器，具有无限的可能。这种机器不仅可以胜任复杂计算，还可以绘画和编曲……」，我们没有理由拒绝人工智能为人类社会带来的无限可能。历史上大多数开创性技术的发端都多多少少会给群体带来不适与不安，然而我认为，越是这样，越需要正视，技术源于人，它不但是人类的扩展功能与补丁，更重要的是，它重定义了人。技术也和音乐一样，需要人类更多的爱。

稿件邮箱：csmes@126.com
投资合作：csmes010@126.com
大学生扶植：QQ 535915667
广告业务：QQ 130081156

投诉专线:13522662065