基于 BERT+PET 方式文本分类介绍

项目介绍

本章我们将以"电商平台用户评论数据"为背景，基于 BERT+PET（硬模版）方法实现评论文本的准确分类

PET（PatternExploiting Training）的核心思想是：根据先验知识人工定义模版，将目标分类任务转换为与 MLM 一致的完形填空，然后再去微调 MLM 任务参数。

图中示例 1：情感分类任务（好评还是差评），

原始文本:这家店真不错,值得推荐。PET模板: [MASK] 满意。Label:不/很。标签词映射（Label Word Verbalizer）：例如如果[MASK] 预测的词是“不”，则认为是差评类，如果是“很”，则认为是好评类。

图中示例 2：新闻分类任务（多分类），

原始文本：中国女排再夺冠！PET 模版：下面是 [MASK] [MASK]新闻，Label：体育/财经/时政/军事。

PET 方式实现过程：将模版与原始文本拼在一起输入预训练模型，预训练模型会对模板中的 mask 做预测，得到一个 label。

PET 方式的特点

本项目基于 torch+ transformers 实现，运行前请安装相关依赖包：

shell

torch
transformers==4.22.1
datasets==2.4.0
evaluate==0.2.2
matplotlib==3.6.0
rich==12.5.1
scikit-learn==1.1.2
requests==2.28.1