您当前的位置:
首页 > 文献资料
所属专业:
Bi-LSTM文献资料
-
基于字词联合训练的Bi-LSTM中文电子病历命名实体识别
为了实现对中文电子病历中实体的自动化识别与信息抽取,提出了一种基于字词联合训练的双向长短时记忆网络(Bi-LSTM)命名实体识别新算法.根据中文语言特性,在传统词向量中融入字向量的语义信息并将其作为神经网络的输入.实验过程中训练集、验证集与测试集随机按电子病历数量的3:1:2的概率生成.通过对比论文提出的语言模型与其他模型,实验结果显示基于字词联合训练的Bi-LSTM能达到高准确率98.28%与低复杂度1.169.该结果证明提出的模型能有效识别中文电子病历中如疾病、症状等相关实体,为自动化处理医学文本数据提供现实基础.