在自然语言处理中，监督学习和非监督学习哪一种是最合适的方法？ - 问答

我不确定什么才是最合适的，但是有很多采用半监督和远程监督的方法。我不是这些方面的专家，但是你可以使用关键字远程监管和信息提取来在Google上搜索很多好东西。

也许，半监督学习中最著名的例子是语音识别和机器翻译的问题。基本上，在两个任务中，你都具有并行数据：使用不同语言或语音功能和转录的相同（或相似）句子。但是，没有为你提供对齐数据：例如，你不知道哪些声学特征代表哪些音素和字母。

有趣的是，人们称这种设置为监督，但很明显，这并不完全正确。无论如何，你的学习算法必须同时推断对齐和翻译模型，这是相当困难的。在过去，这些问题是通过使用期望最大化算法的变量来解决的。现在，我们使用端到端神经网络(CTC, listen-attend-spell)或混合方法(HMM-DNN)。

最后但并非最不重要的是，无监督的预训练和表示学习可能被认为是部分无监督的方法。例如，您可以使用word2vec算法训练单词嵌入，并将嵌入插入神经网络，该神经网络进行POS标记和/或问题回答

2021-01-19 18:12 更新

同步 • 1738

理工酷