checkpoints_iterator
1 | for ckpt in tf.contrib.training.checkpoints_iterator( |
持续捕捉最新的checkpoint,两次捕捉之间的最大等待时间为 eval_timeout
什么用?
用于训练验证并行,之前是交替
一个设备训练,产生checkpoint,一个设备捕捉验证
1 | for ckpt in tf.contrib.training.checkpoints_iterator( |
持续捕捉最新的checkpoint,两次捕捉之间的最大等待时间为 eval_timeout
什么用?
用于训练验证并行,之前是交替
一个设备训练,产生checkpoint,一个设备捕捉验证
graph定义了计算方式(计算流程),本身不会进行任何计算
session帮助graph计算
可以定义多个graph,例如一个graph实现z = x + y,另一个graph实现u = 2 * v
[PAD]:要将句子处理为特定的长度,就要在句子前或后补[PAD]
[CLS]:句子的开始
[SEP]:分开两个输入句子
[mask] :遮盖句子中的一些单词
[UNK]:标记词典内没有的词
TLM : Translation Language Modeling
DAE: Denoising Autoencoder
CTL: Contrastive Learning
RTD: Replaced Token Detection
SOP:Sentence Order Prediction
DIM:Deep InfoMAx