Python在中医药数据挖掘中的应用

传承是中医药发展创新的基础,名中医经验继承是其中尤为重要的环节,名中医经验传统的传承模式师带徒,是以纸质病案、口述等原始的方式总结和继承,所获得的经验或知识常常是个别的、零散的。随着大数据、云计算、人工智能(Artificial Intelligence,AI)等信息技术不断发展,各行各业的生产模式正在发生巨大变革,在此背景下,如何利用计算机技术全面保存和研究名中医的临床经验和学术思想,成为近年来中医学者们研究的重要课题,也是国家构建中医药大数据应用平台,推进中医药信息化的政策需求。

中医药行业作为我国传统医学及经验医学,在2500多年的历史传承中,总结积累了大量的临床经验,成为天生的大数据,亟待利用信息化技术来挖掘其价值,迫切地需要从庞大的临床数据中提取有效信息,为中医药的传承、发展、创新提供数据支持。数据挖掘即从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中发现隐含的、规律性的、人们事先未知的,但又是潜在有用的并且最终可理解的信息和知识的过程。

目前已有不少学者致力于将数据挖掘技术运用于名老中医经验传承,旨在通过现代信息学技术挖掘和解析名医医案,以更好的传承中医临床经验。例如中国中医科学院中药研究所和中国科学院自动化研究所联合开发的中医传承辅助工具中医传承辅助 台(Traditional Chinese Medicine Inheritance Support System,TCMISS),这一平台构建了面向临床数据的中医诊疗信息采集模块、面向中医药本体的知识管理和服务模块、面向传承创新的隐性知识挖掘模块等几大功能模块,自开发以来已逐步广泛应用于中医药领域研究,丰富了中医传承模式并发挥了重要作用,还有张宾等学者对周仲瑛教授辨治原发性肝癌的医案进行整理和研究,通过逐项录入Excel 2010,建立病案数据库,对数据库中的病机与方药、症状与药物进行关联规则分析,分析其中的配伍组合规律。

Python 语言简洁易学、灵活开放、开源免费,在中医药数据挖掘中有着不可替代的优势,而国内外尚未有基于 Python构建名中医医案数据挖掘平台的报道。湖南省名中医蒋益兰教授团队在临床经验数据挖掘工作中选择引入 Python 语言,通过 Python 编写代码构建可视化数据挖掘应用平台,目前已将蒋益兰教授 2017 年-2020 年 Word 格式的门诊病历整理为CSV 数据库后进行数据分析,整理了蒋教授以“健脾消癌方”为代表的经验方及药物加减规律,大大提高了医案数据挖掘的工作效率,运用 Python在中医药方面的独特优势,能够更好地揭示中医药大数据中隐藏的关键信息。

Python语言的特点和优势

Python 是一种开源免费的计算机程序设计语言,是目前人工智能开发的主流语言,近年来逐渐成为最受欢迎的程序设计语言之一。Python现已广泛应用在机器学习、概率分析、统计分析等人工智能场景。例如谷歌的 AlphaGo 项目研发与 Python 有关。同时,百度、阿里巴巴、网易、新浪等大型互联网公司的人工智能项目也是基于 Python 研发。相比 Java、C++等其他编程语言,Python语言语法清晰,概念相对简单,编写的代码短小、简练、易读,可操作性更强、可拓展性强、易于维护。Python常常被称为胶水语言,能够把其他编程语言设计的各种模块(尤其是 C、C++以及 MySQL 等各种数据库)轻松地联结在一起。同时,Python支持调用庞大的第三方库,能够处理海量数据,对各种文件和数据库的支持都非常良好,因此十分适合编写数据库之间、数据库与文件之间相互导入导出数据的脚本,是大数据处理的首选语言。

名中医医案数据挖掘应用平台的整体架构

本平台基于 Python 语言,结合降维分析、聚类分析、相关性分析等算法,开发一种中医医案数据挖掘的应用系统,可在计算机设备与 Web 服务器进行交互。本平台不仅操作便捷、计算准确,还可以基于数据特点进行复杂数据的预处理工作,并能够对医案进行多方位综合的统计分析,并设计了药物的性味归经分析多种具有中医药特色的分析模块;借助于图形或表格等可视化手段更好地体现数据挖掘流程,展示大数据中隐藏的关键信息,使医疗大数据更合理地应用于名中医经验的保存与继承。名中医医案数据挖掘应用平台主要分为前端操作界面、后端算法集成平台及数据库。

第一部分是前端操作界面采用Ajax、HTML5、jQuery、JavaScript 等技术实现与后端算法集成平台的数据交互,并通过 ECharts、Bootstrap 等工具实现应用过程的可视化展示;第二部分的后端算法集成平台则主要采用Python语言、并辅以 Django框架等技术实现与前端及数据库的数据交互,Pyecharts技术实现过程的可视化。第三部分通过MySQL、Navicat等工具设计数据库,实现对数据及分析结果的储存和管理,以供前端操作界面与后端算法集成平台调用。 名中医医案数据挖掘应用平台分为数据录入、数据管理、数据查询、数据分析、分析结果5个功能模块,工作人员可将名中医医案数据通过数据录入模块中的上传与存储功能导入系统数据库中,通过数据管理可根据实际需要进行对数据进行相应的整理和调整,并可通过数据查询模块查找既往录入的数据,数据分析功能对医案数据进行数据挖掘,分析并生成可视化图表,然后通过任务分析结果模块中的查看功能对图表进行查看与管理。

本应用平台运行稳定,操作便捷,计算准确、高效,可以使不具备数据挖掘领域技能的工作人员独立进行名中医医案数据的管理与分析,推动了中医药传承的信息化建设,具有一定的实际应用价值,不仅可以辅助名老中医经验传承,帮助新药、新方创制,还能够帮助中青年骨干医师回顾与复习自身的病案,加快临床经验总结,提升诊疗水平;有利于青年医师学习名中医经验、收集典型病案、管理文献中的验案资料,进行用药规律的分析与总结,缩短青年医生成才周期。需要指出的是,本平台的开发及应用优势最主要依赖于 Python语言,它开源免费,简单易学、可操作性强,在本平台的建构中发挥了不可替代的作用。

Python在中医药数据挖掘中的运用

现在已有一些学者通过 Python 辅助中医药数据挖掘的研究工作,如邓怡然等人基于数据挖掘技术分析,运用 Python、SPSS 对针灸治疗经前期综合征选穴规律进行描述性分析、系统聚类规则分析和关联规则分析;刘曾晶等人收集“中国方剂数据库”中的抗肿瘤方剂,建立抗肿瘤方剂数据库,使用 Python 对方剂所涉及的中药及其功效分类进行关联规则分析,以挖掘抗肿瘤方剂的关联关系。除此之外,还有学者将Python 运用于其他民族医学的经验继承与数据挖掘,如文成当智等人在Python代码下构建藏族医学治疗“年壬”方剂的数据库,挖掘其方剂配伍规律和药性组合等隐形用药规律。这些研究虽然只是在数据挖掘的某一过程中运用 Python语言,而未形成一完成的数据挖掘平台,但他们成功的经验仍然能够说明 Python在中医药乃至其他少数民族医学的数据挖掘中发挥的独特优势。

本站 [ 羽儂医话 ] 内除注明转载文章,均为本人独立创作,采用「CC BY-NC-ND 3.0」创作共享协议。
原创不易,欢迎保留原文链接转载,原文链接:https://yunong.me/1472.html
THE END
分享
二维码
打赏
< <上一篇
下一篇>>