搭建医疗问诊机器人

Contents

项目简介
数据介绍
数据处理
模型搭建
模型训练和验证
模型预测（人机交互）

项目简介

项目背景

目标：聊天机器人是一种基于自然语言处理技术的智能对话系统，能够模拟人类的自然语言交流，与用户进行对话和互动。聊天机器人能够理解用户的问题或指令，并给出相应的回答或建议。其目标是提供友好、智能、自然的对话体验。
应用：当前，聊天机器人在多个领域得到广泛应用。首先，它们常用于在线客服系统，能够快速、准确地回答用户的常见问题，解决疑问。其次，聊天机器人可以作为个人助手，提供个性化的推荐、建议和日程安排等服务，提升用户体验。此外，聊天机器人还被应用于社交娱乐、语言学习、旅游指南等领域，为用户提供有趣、便捷的对话体验。

常见的相关聊天机器人产品

微软小冰
微软公司开发。它具备自然语言处理、情感分析和对话生成等功能，能够与用户进行智能对话，提供情感支持和娱乐等服务

阿里云小蜜
阿里云公司推出，提供了丰富的智能对话服务。它具备自然语言处理和对话管理能力，支持多领域的应用场景，如在线客服、智能助手和虚拟导购等
百度智能云小度
百度智能云开发，提供了多领域的智能对话能力。小度机器人可应用于家庭助理、智能音箱和移动应用等场景，通过语音和文本交互与用户进行智能对话，提供信息查询、音乐播放和日程安排等功能。

本项目基于医疗领域数据构建了智能医疗问答系统，目的是为用户提供准确、高效、优质的医疗问答服务。

环境准备

python==3.12
transformers>=4.2.0
pytorch>=1.7.0

项目整体结构

数据介绍

数据存放位置 /data，文件夹里面包含 medical_train.txt、medical_valid.txt 2 个文件

数据示例：

帕金森叠加综合征的辅助治疗有些什么？
综合治疗；康复训练；生活护理指导；低频重复经颅磁刺激治疗

卵巢癌肉瘤的影像学检查有些什么？
超声漏诊；声像图；MR 检查；肿物超声；术前超声；CT 检查

数据格式：每段医患对话之间用\n隔开，一共约 3w 对聊天记录

数据处理

数据处理简介

目的：将中文文本数据处理成模型能够识别的张量（数字）形式。

基本流程如下：

注意：我们这里省略的了数据格式的转换，目的，将非 txt 的文档转换为 txt 的形式，并符合上述数据格式要求

代码路径

数据处理脚本：Gpt2_Chatbot/data_preprocess/preprocess.py

构建 dataset 脚本：Gpt2_Chatbot/data_preprocess/dataset.py

构建 dataloader 脚本：Gpt2_Chatbot/data_preprocess/dataloader.py

注意：具体代码实现参考 pdf

模型搭建

模型架构介绍

模型架构解析：

输入层：词嵌入层：WordEmbedding +位置嵌入层：PositionEmbedding
中间层：Transformer 的 Decoder 模块---12 层
输出层：LayerNorm 层 + 线性全连接层

模型主要参数简介 (详见模型的 config.json 文件):

n_embd: 768
n_head: 12
n_layer: 12
n_positions: 1024
vocab_size: 21128/13317（可以选择和 config.jison 对齐）

GPT2 模型准备

本次项目使用 GPT2 的预训练模型，因此不需要额外搭建 Model 类，下面代码是如何直接加载使用 GPT2 预训练模型。

python

from transformers import GPT2LMHeadModel, GPT2Config

# 创建模型
if params.pretrained_model:
    # 加载预训练模型
    model = GPT2LMHeadModel.from_pretrained(params.pretrained_model)
else:
    # 初始化模型
    model_config = GPT2Config.from_json_file(params.config_json)
    model = GPT2LMHeadModel(config=model_config)

模型训练和验证

主要代码

代码路径

训练脚本：Gpt2_Chatbot/data_preprocess/train.py

辅助工具类脚本：Gpt2_Chatbot/data_preprocess/functions_tools.py

注意：具体代码实现参考 pdf

模型预测（人机交互）

模型预测

运行 interact.py，使用训练好的模型，进行人机交互，输入 Ctrl+Z 结束对话之后，聊天记录将保存到 sample 目录下的 sample.txt 文件中。

脚本路径：/Users/user/PycharmProjects/llm/Gpt2_Chatbot/interact.py

基于 flask 框架，实现 web 界面的交互。

脚本路径：/Users/user/PycharmProjects/llm/Gpt2_Chatbot/flask_predict.py

注意：具体代码实现参考 pdf

搭建医疗问诊机器人 ​

项目简介 ​

项目背景 ​

常见的相关聊天机器人产品 ​

环境准备 ​

项目整体结构 ​

数据介绍 ​

数据处理 ​

模型搭建 ​

模型架构介绍 ​

GPT2 模型准备 ​

模型训练和验证 ​

模型预测（人机交互） ​

搭建医疗问诊机器人

项目简介

项目背景

常见的相关聊天机器人产品

环境准备

项目整体结构

数据介绍

数据处理

模型搭建

模型架构介绍

GPT2 模型准备

模型训练和验证

模型预测（人机交互）