0
在自然语言处理/计算语言学中,有许多表示单词的方法,其中,有两种突出的方法使用向量来表示它们。
大体上来说,这两种方法是:
分布语义:用一个非常高维的稀疏向量表示一个单词,其中每个维反映单词在语料库中发生的上下文。例如,上下文可以是在附近出现的另一个单词。
词嵌入:用低维向量表示一个词(例如100个维度)。维度通常是潜在的,并且通常使用分布语义方法中的信息获得(例如LSA, word2vec)。
这些向量通常通过点积或其他向量运算来获取一些相似的概念。
收藏