首页 > 文献资料
-
中文病历文档术语提取和否定检出方法
利用生物医学术语系统中的词汇和概念,为存有大量珍贵信息的非结构化临床文档建立有效的索引,以便进行信息挖掘和利用,国际上相关研究已经开展多年,而基于中文病历文档概念索引的研究尚属空白.本研究将现有的中文版的国际疾病分类(ICD)集成到统一医学语言系统(UMLS)中,依据中文语言处理的特殊性,对中文电子病历文档进行统计分析,提出了一套中文病历文档术语提取和否定检出的方法,可用于建立中文病历文档的概念索引.术语提取阶段利用高灵敏的大匹配法并结合通用分词技术来控制假阳性;而在概念否定意义检出部分,充分利用中文特点并基于现有中文处理技术提出了一种简化的子句模式匹配方法.选取了两组医疗文本数据集对算法进行了验证,术语提取算法的灵敏性分别为99.51%和100%,误检率分别为1.46%和1.66%.否定检出算法的阳性预测值均为100%,阴性预测值分别为100%和98.99%,除标点使用不规范等文书质量问题外,基本可以正确检出.
-
医学语言处理技术及应用
长期以来,病历都是以一种叙述性的自然语言方式来记录,医学文献中大量的生物医学知识也是以自然语言形式存在.这些叙述性文本信息的自动利用需要自然语言处理技术,因而医学语言处理就成为医学临床实践和转化医学为核心的信息技术挑战,它对于我国医疗信息化具有重要意义.