您当前的位置:
首页 > 文献资料
所属专业:
语义相似度文献资料
-
基于语义相似度的ICD-10编码归一化
国内各医疗机构在国际ICD-104位编码的基础上,根据自身需求进行的编码扩展造成了机构之间病案编码在4位之后的不一致.这种人为造成的信息孤岛,限制了以编码为基础的医疗数据的共享共认及以大数据和机器学习为基础的研究方法在医疗数据上应用,因此提出基于语义相似度的ICD-10的6位编码归一化框架.首先以国家新颁布的《GB/T 14396-2016疾病分类与代码》为标准建立标准库,然后通过数据清洗、多词映射、三级匹配、编码转换等步骤实现了不同医疗机构ICD-10的6位编码的统一,为病案数据的共享共认、区域统计分析以及大数据分析提供基础.
-
基于语义相似度计算的临床诊断自动编码算法研究
提出一种为中文临床诊断自动进行ICD-10编码的算法,利用分布式语义相似度计算方法计算文本语义相似度,考虑到中文的语言特点,不仅基于词语构建词向量,还基于汉字构建词向量,测试二者对查准率和查全率的影响.结果显示该算法在测试集上获得较高的准确率.