当前位置: X-MOL 学术J. Web Semant. › 论文详情
Our official English website, www.x-mol.net, welcomes your feedback! (Note: you will need to create a separate account there.)
An empirical study of representing adjectives over knowledge bases: Approach, lexicon and application
Journal of Web Semantics ( IF 2.5 ) Pub Date : 2021-11-27 , DOI: 10.1016/j.websem.2021.100681
Jiwei Ding 1 , Wei Hu 1 , Xin Yu 1 , Yuzhong Qu 1
Affiliation  

Adjectives are common in natural language, and their usage and semantics have been studied broadly. In recent years, with the rapid growth of knowledge bases (KBs), many knowledge-based question answering (KBQA) systems are developed to answer users’ natural language questions over KBs. A fundamental task of such systems is to transform natural language questions into structural queries, e.g., SPARQL queries. Thus, such systems require knowledge about how natural language expressions are represented in KBs, including adjectives. In this paper, we specifically address the problem of representing adjectives over KBs. We propose a novel approach, called Adj2SP, to represent adjectives as SPARQL query patterns. Adj2SP contains a statistic-based approach and a neural network-based approach, both of them can effectively reduce the search space for adjective representations and overcome the lexical gap between input adjectives and their target representations. Two adjective representation datasets are built for evaluation, with adjectives used in QALD and Yahoo! Answers, as well as their representations over DBpedia. Experimental results show that Adj2SP can generate representations of high quality and significantly outperform several alternative approaches in F1-score. Furthermore, we publish Lark, a lexicon for adjective representations over KBs. Current KBQA systems show an improvement of over 24% in F1-score by integrating Adj2SP.



中文翻译:

在知识库上表示形容词的实证研究:方法、词汇和应用

形容词在自然语言中很常见,其用法和语义已被广泛研究。近年来,随着知识库(KB)的快速增长,开发了许多基于知识的问答(KBQA)系统来回答用户在知识库上的自然语言问题。此类系统的一项基本任务是将自然语言问题转换为结构化查询,例如 SPARQL 查询。因此,此类系统需要了解自然语言表达如何在知识库中表示,包括形容词。在本文中,我们专门解决了在 KB 上表示形容词的问题。我们提出了一种称为 Adj2SP 的新方法,将形容词表示为 SPARQL 查询模式。Adj2SP 包含基于统计的方法和基于神经网络的方法,它们都可以有效地减少形容词表示的搜索空间,克服输入形容词与其目标表示之间的词汇差距。为评估构建了两个形容词表示数据集,其中形容词用于 QALD 和 Yahoo! 答案,以及它们在 DBpedia 上的表示。实验结果表明,Adj2SP 可以生成高质量的表示,并且在 F1 分数中明显优于几种替代方法。此外,我们发布了 Lark,这是一个用于 KB 上的形容词表示的词典。当前的 KBQA 系统通过集成 Adj2SP 将 F1 分数提高了 24% 以上。QALD 和 Yahoo! 中使用的形容词 答案,以及它们在 DBpedia 上的表示。实验结果表明,Adj2SP 可以生成高质量的表示,并且在 F1 分数中明显优于几种替代方法。此外,我们发布了 Lark,这是一个用于 KB 上的形容词表示的词典。当前的 KBQA 系统通过集成 Adj2SP 将 F1 分数提高了 24% 以上。QALD 和 Yahoo! 中使用的形容词 答案,以及它们在 DBpedia 上的表示。实验结果表明,Adj2SP 可以生成高质量的表示,并且在 F1 分数中明显优于几种替代方法。此外,我们发布了 Lark,这是一个用于 KB 上的形容词表示的词典。当前的 KBQA 系统通过集成 Adj2SP 将 F1 分数提高了 24% 以上。

更新日期:2021-12-06
down
wechat
bug