0
目前有三种类型的实现方案
- 第一种就是检索式,比如答案是事先编辑好的,并不会随便生成,在检索式里面又会分为两大类:第一类是用大量的语料和模型来训练,收集大量的语料,把问题和答案给一个神经网络的模型,用这个模型帮我去找到问题和答案之间的相关度,这样的话,就能够用大量的语料训练出聊天机器人模型,这是最常见的一种方式;
- 第二种方式是基于规则来做,使用类似于之前介绍过的 Alice 机器人所用到的 AIML 标记语言,写大量的 pattern,以及在这个 pattern 下所需要的答案,写大量这样的人工规则就可以做一个检索式的机器人,但是这仅限于少量的小规模应用,如果需要编辑大量的规则,规则之间可能会有冲突等问题,所以主流的这种聊天机器人的方式是我们说到的第一种,用统计模型和大量的语料来训练聊天机器人。
- 第三种是生成式的聊天机器人,我需要把我的答案直接生成出来,这种方式是需要限定在一定的领域里面。开放领域里直接生成式的聊天机器人会有一些敏感词的问题,因为语料一般是网上收集的,想做到所有语料都人工审核成本是巨大的。所以说生成式需要把它限定在一个特定的领域里面,生成式分为两种:一种是纯粹的生成,一种是基于一些模板来生成。
收藏