近似训练


Vincent
发布于 2024-04-07 / 5 阅读 / 0 评论 /
近似训练 回想一下我们的讨论。跳元模型的主要思想是使用softmax运算来计算基于给定的中心词��生成上下文字��的条件概率),对应的对数损失在给出。 由于softmax操作的性质,上下文词可以是词表�中的任意项,包含与整个词表大小一样多的项的求和。因此, 中跳元模型的梯度计算和 中的连续词袋模型的