远谈不上理解人类语言。
Word2vec实用价值在于,它是主题、风格、情感等更高级建模或分析基础。曾抽取楸帆作品中代表性较强词汇,计算得到每个词对应Word2vec向量数值,再通过数学变换将百多维空间中向量转换成二维或三维人类可见图像[8]——这是标准、科学意义上“降维打击”。例如,后图(见下页)是从楸帆收录在这本书中六篇小说文本中,抽样提取代表性词汇生成空间分布示例(不同小说中语词在图中对应于不同形状标记)。
在电脑上,类似分布图可以针对每个空间局部或每个聚合主题,进行放大和细化。词汇在不同空间层级、区域聚合关系,可以直观地反映每篇小说、每个章节甚至每个段落写作特点。类似工具还可以很方便地比较不同作家文本差异。例如,们完全可以将楸帆《人生算法》和保罗·巴奇加卢皮《卡路里人》进行类似主题分析和词汇比较。再例如,即便们知道楸帆《美丽新世界孤儿》是向赫胥黎《美丽新世界》致敬作品,但精密文本分析也足以向们呈现出两部作品在语汇和主题层面异同。从这个意义上说,未来文学批评领域文本比较,几乎定会演进成全面由计算机参与、逻辑缜密科学过程。
《人生算法》六篇小说文本中抽样词汇生成空间分布示例
惧怕科技工具人常常担心这类分析会禁锢小说作者灵感和创作欲。但是,想想今天围棋世界吧,在AlphaGo和大批顶级AI围棋软件接连问世后,中日韩国手们不是已经开始用AI选点和胜率来分析自己每手棋吗[9]?小说创作者有认知自己作品内在特征和语义边界权利。构思、创建新作品时,他有足够自由去选择新作品主题与语言风格,而这种选择权往往要建立在精准分析基础上。无论是在谋篇布局宏观层面,还是在词句段落微观层面,带着个比人类大脑更加讲求科学逻辑机器顾问,是不是总会好过全凭感觉独立写作?
更进步AI文本分析必然会向着美学角度发展。确,AI目前还没法拥有比肩人类审美能力,或具备人类爱憎好恶世俗情感。但这不妨碍们利用AI工具,对不同作者、不同类型文本进行美学或情感意义上分类。这方面,们可以参考图像领域例子:在美图之类美颜APP里,用户自拍、美颜、上传或存储操作本身,就是对图像在美学和情感意义上次标注,即:只有上传或存储图像,才是该用户认为“美”图像。当类似信号刺激足够多时,AI算法就可以大显身手,轻松地基于大数据建立起“美/不美”“可爱/不可爱”“好/差”之类自动分类器。在文本领域,Kindle或类似图书阅读器可以轻易收集到用户阅读时重点标注句子或段落,如果再结合语义属性,AI有可能创造出套可行机制,将大量文本内容分成“美/不美”“高雅/庸俗”“硬科幻/软科幻”等类别。即便不考虑未来可能性,们是不是已经可以说AI拥有初步文学批评能力?
在《恐惧机器》这篇小说里
请关闭浏览器阅读模式后查看本章节,否则可能部分章节内容会丢失。