您当前的位置:
首页 > 文献资料
所属专业:
中药方剂与疾病关系抽取文献资料
-
面向文摘的中药方剂与疾病关系抽取
目的:利用机器学习的方法,从文献摘要数据入手,研究中药方剂与疾病的相关性.方法:在中国知网的“文献分类目录”中选取“医药卫生科技”—“中医学”类别,使用网络爬虫技术获取摘要数据,经过数据清洗、构建词典、分词等预处理步骤,使用自然语言处理技术对处理后的文本数据进行特征提取,并构建支持向量机(Support Vector Machine,SVM)分类模型,对中药方剂与疾病进行关系抽取.结果:共爬取1073581篇摘要,根据中药方剂与疾病词典筛选出同时包含中药方剂与疾病的语句共204780句,利用句法解析抽取的特征构建SVM分类模型,准确率达87%,将该SVM模型应用于筛选后的句子,终得到中药方剂与疾病之间的关系三元组.结论:利用机器学习方法对中国知网中医学摘要文本数据进行关系抽取,得到的中药方剂与疾病的关系三元组,将对中药方剂治疗疾病研究起积极推动作用.
关键词: 中药方剂与疾病关系抽取 抽取数据 中医药数据抽取 网络爬虫技术