对于输入需要分词

输入的序列前面需要加上cls,,后面需要加上seq。

在这个基础上如果凑不够input的值,,则会填充两个padding。

image-20260114145213715

Bert的参数

image-20260114145256379