checkpoints_iterator
1 | for ckpt in tf.contrib.training.checkpoints_iterator( |
持续捕捉最新的checkpoint,两次捕捉之间的最大等待时间为 eval_timeout
什么用?
用于训练验证并行,之前是交替
一个设备训练,产生checkpoint,一个设备捕捉验证
1 | for ckpt in tf.contrib.training.checkpoints_iterator( |
持续捕捉最新的checkpoint,两次捕捉之间的最大等待时间为 eval_timeout
什么用?
用于训练验证并行,之前是交替
一个设备训练,产生checkpoint,一个设备捕捉验证
graph定义了计算方式(计算流程),本身不会进行任何计算
session帮助graph计算
可以定义多个graph,例如一个graph实现z = x + y,另一个graph实现u = 2 * v
多卡训练时候,net的forward里面存在Tensor变成其它类型的操作,比如变成numpy,list
解决:改成Tensor操作
https://blog.csdn.net/weixin_41990278/article/details/90311313
https://zhuanlan.zhihu.com/p/37102973
随着TF2.0出现,TF也有动态图了
NO. there is no string tensor so you cannot directly convert string to tensor
https://blog.csdn.net/HailinPan/article/details/109818774
1 model.load_state_dict(torch.load(path))
2 model=BertModel.from_pretrained
后者的底层为前者
用法不同,前者model为一个对象,然后用load_state_dict加载权重;后者BertModel为一个类,然后用from_pretrained创建对象并加载权重