语言模型和数据集


Vincent
发布于 2024-04-07 / 16 阅读 / 0 评论 /
语言模型和数据集 我们了解了如何将文本数据映射为词元, 以及将这些词元可以视为一系列离散的观测,例如单词或字符。 假设长度为�的文本序列中的词元依次为�1,�2,…,��。 于是,��(1≤�≤�) 可以被认为是文本序列在时间步�处的观测或标签。 在给定这样的文本序列时,语言模型(language