- · 《分析试验室》征稿要求[09/07]
- · 《分析试验室》投稿方式[09/07]
- · 《分析试验室》收稿方向[09/07]
- · 《分析试验室》数据库收[09/07]
- · 《分析试验室》栏目设置[09/07]
- · 《分析试验室》刊物宗旨[09/07]
贝尔实验室和周公“掰手腕”:AI算法解梦成为现(3)
作者:网站采编关键词:
摘要:水平在20世纪60年代相当可观,经过调查得出假设:经历过“社会动荡时期”的人,其梦境以攻击性为特征。这个假设通过调查9.11恐怖袭击得到了验证。
3
基于成分的NLP分析
作者在论文中采用的是霍尔和范德卡斯尔梦境编码系统,这一系统是从《梦的内容分析(The content analysis of dreams)》中提取出来,霍尔和范德卡斯尔系统一共将梦境分为了10个类别:
1、人物:人物、动物或者其他特征
2、互动:人物之间的社交互动(如接吻)
3、情绪:人物经历的情绪或表示某种情况的情绪(如悲伤);
4、活动:角色执行的身体动作和感官体验(例如嗅觉);
5、奋斗:主人公的成功或失败;
6、(失误)命运:由于主人公的行为,导致了主人公身上发生了幸运和不幸;
7、设置和对象:场景中存在的物理环境或对象(例如户外、武器);
8、描述性要素:物体、人物和动作的属性和质量(如颜色、大小、速度);
9、食物和进食:食物的存在或进食行为;
10、来自过去的元素:和主人公过去有联系的人物或元素(例如年轻的自己);
当然,以上10个元素并不是同等重要,其中有三类:人物、社会互动和情绪是最有价值的。因为这三个因素包含了:谁在场,有哪些行动,表达了哪些情感等信息。作者也将重点放在根据反映这三个类别的衡量标准对每个梦境报告进行编码。编码结果如下:
有了上述三个指标,作者然后设计算法分析名为“梦库(Dream Bank)”的大型公共梦境报告数据库中的份梦境报告(DreamBank是一个由经过验证的研究收集的梦的公共数据库)。
算法工具在梦的报道例子中的应用。
整个算法的分析过程为:1、通过构建动词(VBD)和名词(NN,NNP)树来解析梦境。然后使用两个外部知识库,使得算法能够识别名词中的人物、动物和虚构人物;3、根据人物的性别、是否死亡以及是否虚构对人物进行分类;4、识别表示友好、攻击性和性互动的动词;5、根据每个动词的两个行为者(动词前的名词和动词后的名词)可识别与否,确定每个动词是否反映“互动”场景;;6、以及使用Emolex识别正面和负面情感词。
在具体的自然语言技术上,该算法主要基于成分的分析。即将梦境报告文本进行分解解成部分,然后可以独立地对其进行分析。这里的成分指的是:作为连贯单位表现的词组,它们要么属于短语类别(例如名词短语、动词短语),要么属于词汇类别(例如名词、动词、形容词、连词、副词)。
随后将“组成成分”被反复分割成单个词水平的“子组成成分”。这个过程的结果是一棵解析树,即一个树状图,树的根是初始句子,结点是成分和子成分,叶子是单个单词。
成分被迭代地拆分为子成分,向下延伸到单个单词的级别。该过程的结果是语法分析树,即树状图,其根是初始句子,边是反映英语语法结构的产生式规则(例如,根据主谓划分拆分完整的句子),节点是成分和子成分,而叶子是单独的单词。
在所有公开可用的基于成分的分析技术中,作者的算法结合了来自Python NLTK 工具包的StanfordParser(这是一个基于概率上下文无关文法的解析器)。该工具输出解析树,并用相应的词汇或短语类别注释节点和叶子。
在构建树之后,通过应用NLTK中的形态函数Morphy,该工具将树叶中包含的所有单词转换为相应的词条(例如,它将“dreaming” 转换成 “dream”)。
Via
文章来源:《分析试验室》 网址: http://www.fxsys.cn/zonghexinwen/2020/0907/348.html
上一篇:分析试验室杂志
下一篇:权威实验室测试老蛙50mm F2.8,用数据说话它有多