2022-06-11 5a4b09b0454c02615322f44b6581c606 99+ 2 m 0.2 k

text Span抽取

基于问题在段落中寻找答案

1
2
3

1 问题：苏轼是哪里人？
2 描述：苏轼是北宋著名的文学家与政治家，眉州眉山人。
3 标签：眉州眉山人

bert中的SQuAD问答任务

结构

损失

sequence_output = all_encoder_outputs[-1] #[src_len, batch_size, hidden_size]
logits = self.qa_outputs(sequence_output)  # [src_len, batch_size,2] 
start_logits, end_logits = logits.split(1, dim=-1)
start_logits = start_logits.squeeze(-1).transpose(0, 1)  # [batch_size,src_len]
end_logits = end_logits.squeeze(-1).transpose(0, 1)  # [batch_size,src_len]
loss_fct = nn.CrossEntropyLoss(ignore_index=ignored_index)
start_loss = loss_fct(start_logits, start_positions)
end_loss = loss_fct(end_logits, end_positions)
final_loss=(start_loss + end_loss) / 2

模型输出为： [src_len, batch_size,2]

两个（start 和 end ）src_len分类的平均