0
LSTM在其核心部分中保留了已经使用隐藏状态通过的输入的信息。
单向LSTM仅保留过去的信息,因为它看到的唯一输入就是过去的信息。
双向LSTM将以两种方式来运行输入,一种是从过去到未来,另一种是从未来到过去,这种方法与单向的不同之处在于,在向后运行的LSTM中,你将从未来保存信息,并将两种隐藏状态组合在一起,使得你可以在任何时间点保存来自过去和未来的信息。
它们都适合的是非常复杂的问题,但双向LSTM明显有更好的结果,因为它可以更好地理解上下文。
我用一个例子来做解释。 The boys went to .... 使用双向LSTM,你能够看到更进一步的信息:
向前LSTM: The boys went to ...
向后 LSTM: ... and then they got out of the pool
你可以看到,通过使用未来的信息,网络更容易预测下一个单词是什么。
收藏