谷歌-BERT-第二步:模型使用
1 需求
需求1:基于pipeline使用预训练模型
需求2:基于BertTokenizer/BertForSequenceClassification使用预训练模型
2 接口
3.1 基于pipeline使用预训练模型
from transformers import pipeline
pipeline = pipeline("text-classification", model="./model", tokenizer="./model")
output = pipeline("今天天气不错")
print(output)
3.2
text = "今天天气不错"
# 第一步:数据预处理(Raw text -》Input IDs)
from transformers import BertTokenizer
tokenizer = BertTokenizer.from_pretrained("./model")
input = tokenizer(text, padding=True, truncation=True, return_tensors="pt")
print(input)
# 第二步:模型调用(Input IDs -》Logits)
from transformers import BertForSequenceClassification
model = BertForSequenceClassification.from_pretrained("./model")
output = model(**input)
logits = output.logits
print(logits)
# 第三步:结果后处理(Logits -》Predictions)
import torch
predictions = torch.nn.functional.softmax(logits, dim=-1)
predictions_class = torch.argmax(predictions).item()
print(predictions_class)
print(model.config.id2label.get(predictions_class))
4 参考资料
transformers库的使用【一】——pipeline的简单使用_transformer pipeline-CSDN博客
【人工智能】Transformers之Pipeline(十七):文本分类(text-classification)_文本分类模型排名-CSDN博客
【人工智能】Transformers之Pipeline(十八):文本生成(text-generation)_pipeline('text2text-generation')-CSDN博客