贝尔实验室和周公“掰手腕”：AI算法解梦成为现(3) - 分析试验室杂志社投稿_期刊论文发表|版面费|电话|编辑部|论文发表- 分析试验室

来稿应自觉遵守国家有关著作权法律法规，不得侵犯他人版权或其他权利，如果出现问题作者文责自负，而且本刊将依法追究侵权行为给本刊造成的损失责任。本刊对录用稿有修改、删节权。经本刊通知进行修改的稿件或被采用的稿件，作者必须保证本刊的独立发表权。一、投稿方式： 1、请从我刊官网直接投稿。 2、请从我编辑部编辑的推广链接进入我刊投审稿系统进行投稿。二、稿件著作权： 1、投稿人保证其向我刊所投之作品是其本人或与他人合作创作之成果，或对所投作品拥有合法的著作权，无第三人对其作品提出可成立之权利主张。 2、投稿人保证向我刊所投之稿件，尚未在任何媒体上发表。 3、投稿人保证其作品不含有违反宪法、法律及损害社会公共利益之内容。 4、投稿人向我刊所投之作品不得同时向第三方投送，即不允许一稿多投。 5、投稿人授予我刊享有作品专有使用权的方式包括但不限于：通过网络向公众传播、复制、摘编、表演、播放、展览、发行、摄制电影、电视、录像制品、录制录音制品、制作数字化制品、改编、翻译、注释、编辑，以及出版、许可其他媒体、网站及单位转载、摘编、播放、录制、翻译、注释、编辑、改编、摄制。 6、第5条所述之网络是指通过我刊官网。 7、投稿人委托我刊声明，未经我方许可，任何网站、媒体、组织不得转载、摘编其作品。

贝尔实验室和周公“掰手腕”：AI算法解梦成为现(3)

作者:

关键词:

摘要：

水平在20世纪60年代相当可观，经过调查得出假设：经历过“社会动荡时期”的人，其梦境以攻击性为特征。这个假设通过调查9.11恐怖袭击得到了验证。

基于成分的NLP分析

作者在论文中采用的是霍尔和范德卡斯尔梦境编码系统，这一系统是从《梦的内容分析（The content analysis of dreams）》中提取出来，霍尔和范德卡斯尔系统一共将梦境分为了10个类别：

1、人物：人物、动物或者其他特征

2、互动：人物之间的社交互动(如接吻)

3、情绪：人物经历的情绪或表示某种情况的情绪(如悲伤)；

4、活动：角色执行的身体动作和感官体验(例如嗅觉)；

5、奋斗：主人公的成功或失败；

6、(失误)命运：由于主人公的行为，导致了主人公身上发生了幸运和不幸；

7、设置和对象：场景中存在的物理环境或对象(例如户外、武器)；

8、描述性要素：物体、人物和动作的属性和质量(如颜色、大小、速度)；

9、食物和进食：食物的存在或进食行为；

10、来自过去的元素：和主人公过去有联系的人物或元素(例如年轻的自己)；

当然，以上10个元素并不是同等重要，其中有三类：人物、社会互动和情绪是最有价值的。因为这三个因素包含了：谁在场，有哪些行动，表达了哪些情感等信息。作者也将重点放在根据反映这三个类别的衡量标准对每个梦境报告进行编码。编码结果如下：

有了上述三个指标，作者然后设计算法分析名为“梦库（Dream Bank）”的大型公共梦境报告数据库中的份梦境报告（DreamBank是一个由经过验证的研究收集的梦的公共数据库）。

算法工具在梦的报道例子中的应用。

整个算法的分析过程为：1、通过构建动词(VBD)和名词(NN，NNP)树来解析梦境。然后使用两个外部知识库，使得算法能够识别名词中的人物、动物和虚构人物；3、根据人物的性别、是否死亡以及是否虚构对人物进行分类；4、识别表示友好、攻击性和性互动的动词；5、根据每个动词的两个行为者（动词前的名词和动词后的名词）可识别与否，确定每个动词是否反映“互动”场景；；6、以及使用Emolex识别正面和负面情感词。

在具体的自然语言技术上，该算法主要基于成分的分析。即将梦境报告文本进行分解解成部分，然后可以独立地对其进行分析。这里的成分指的是：作为连贯单位表现的词组，它们要么属于短语类别(例如名词短语、动词短语)，要么属于词汇类别(例如名词、动词、形容词、连词、副词)。

随后将“组成成分”被反复分割成单个词水平的“子组成成分”。这个过程的结果是一棵解析树，即一个树状图，树的根是初始句子，结点是成分和子成分，叶子是单个单词。

成分被迭代地拆分为子成分，向下延伸到单个单词的级别。该过程的结果是语法分析树，即树状图，其根是初始句子，边是反映英语语法结构的产生式规则(例如，根据主谓划分拆分完整的句子)，节点是成分和子成分，而叶子是单独的单词。

在所有公开可用的基于成分的分析技术中，作者的算法结合了来自Python NLTK 工具包的StanfordParser（这是一个基于概率上下文无关文法的解析器）。该工具输出解析树，并用相应的词汇或短语类别注释节点和叶子。

在构建树之后，通过应用NLTK中的形态函数Morphy，该工具将树叶中包含的所有单词转换为相应的词条(例如，它将“dreaming” 转换成 “dream”)。

Via

文章来源：《分析试验室》网址: http://www.fxsys.cn/zonghexinwen/2020/0907/348.html