2022年02期 v.43 35-40页
陈逸墨1 叶辉1 易珺2 周华文1 方丹丹1 曹东1
(1.广州中医药大学医学信息工程学院,广东 广州 510006
2.广东药科大学医药信息工程学院,广东 广州 510006)
摘要:随着电子病历数据开放共享的需求越来越大,电子病历去隐私性问题亟需解决。利用自然语言处理技术,提出一种基于Bert-BiLSTM-CRF模型的电子病历隐私信息识别方法。采用某三甲中医院的电子病历作为数据来源,结合当前公开的数据集进行训练,得到正确率为94.02%、召回率为94.25%、F1为93.98%的中医电子病历隐私信息识别模型。与其他传统模型进行对比实验表明,Bert-BiLSTM-CRF模型能有效识别并保护电子病历中的隐私数据,有助于医疗数据的开放共享。
关键词:隐私信息;Bert;双向长短时记忆网络;条件随机场;电子病历
中图分类号:TP391.1 文献标识码:A 文章编号:1674-2605(2022)02-0006-06
DOI:10.3969/j.issn.1674-2605.2022.02.006