[paper阅读]使用层次解析结构来增强查询理解(三)

前几周主要给大家介绍了论文的背景具体方法两个部分,这一周终于到了实验和结论部分啦。接下来,马上进入使用层次解析结构来增强查询理解的终结篇。Ps:今天是520,对世界说声我爱你!

实验

为了评估提出的方法,作者将电影领域作为示例,并且在真实的电影查询上进行了实验。为了收集到真实用户的自然语言查询,作者们使用了之前在[1]中开发的标注工具包,将AMTAmazon Mechanical Turk

继续阅读

[paper阅读]使用层次解析结构来增强查询理解(二)

首先的首先,祝世界上伟大的母亲们节日快乐~前两周给大家介绍了下论文的摘要和背景部分,这周继续来介绍具体的方法啦~最后还剩下一个实验和结论部分,下周继续~

在本文的提出的方法中,作者们使用了半马尔科夫条件随机场作为查询标记模型,该模型已经在过去的十几年中已经有了很多的研究。在本章节中,作者将会简单介绍这个模型,然后描述使用到模型学习中的语义特征。

模型

半马尔卡夫条件随机场在给定查询的情况下,对基于分段的标签序列的条件概率进行建模。更详细地,给定单词序列 $$x={x_1, x_2, …, x_M}$$,目标是找到 $$ s={s_1, s_2,..,s_N}$$,用来表示输入的分段以及所有分段的分类。 每个分段使用一个元组$$s_j = (u_j,

继续阅读

[paper阅读]使用层次解析结构来增强查询理解(一)

这一周主要初步了解了下查询理解领域的基础知识,先简单介绍下《Query Understanding Enhanced by Hierarchical Parsing Structures》论文的摘要和背景介绍部分,下周将会介绍具体的方法以及实验结果。

摘要

在信息检索领域和口语理解领域都已经对查询理解有了比较好的研究。一般说来,查询理解有三个层次:领域分类/用户意图探测/语义标注等。在真实系统中,可以使用分类器来进行领域分类和兴趣探测,而语义标注(或空位填充)一般可以定义为一个序列标注任务——将单词的序列映射到标签的序列。在学习标签预测模型的过程中,可以从标注的查询中提取出大量统计特征(例如,n-grams);但是,在特征提取过程中,一般会忽略查询的语义特征(例如:层次结构和语义关系)。在本篇文章中,作者们提出了一个利用层次解析树编码语义知识的方法用于查询理解。特别地,对于自然语言查询,作者们从查询解析树中提取了一系列句法的结构特征和语义依赖特征来增强推断模型学习。

继续阅读