古医案研究慎用数据统计

古代医家记写医案是选择性记录,记难不记易、记变不记常 。我们看不到所选医案代表的“总体”,只能看到“样本”,这些样本又不是从总体中随机抽取的,而是选择性记录和保留的,因而不可能真实反映“总体”的情况 。  中医医案,在古代又称诊籍、脉案、方案或病案,它是古代医生临证实践的记录,客观地记录医生诊病中辨证论治和处方用药的过程,是我国历代医家临床经验的结晶 。中医医案是传承历代医家学术思想和经验理论的重要载体,认真研读医案,可以探究医家辨证施治、遣方用药的治病经验,把握名家的治病思想,开启诊病的思路,也可以从医案中借鉴成功经验,汲取失败教训,提高中医学术水准 。因此,当代中医大家都很重视中医病案的学习 。但是,古代医家记写医案是选择性记录,往往喜欢选择记写复杂多变的病情,常规病情则不太收录 。因此,古代医案不是基本医理和常规诊疗的教科书,我们在研读古代医案时,主要也是从中学习复杂病情下古人如何辨证施治 。把古代医案简单地混同于现代病历作数据研究,是一种错误的选择 。  举一个实例:一位硕士研究生在作他的学位论文报告,他的论文是关于某本古代医案专著中血证(论文中指称各种出血病)的研究 。研究者对书中各类出血病人的病情作了分析,并作了简单的数据统计分析 。结论是:在该书中出现的血证病人,以虚寒性出血病人为多 。学中医的人都知道,通常出血病人以实热性出血为多 。作者的统计结果与这个常规情况显然不相一致 。但作者对这个数据的意义没有作说明 。作为答辩老师,我现场提问:“这个数据统计结果意义是什么?是否意味着在这本书或这批病案相对应的历史时期中,出血病人都是虚寒性出血为多?”作者对此显然毫无思考,一时语塞 。  对古代医案“数据挖掘”   易入歧途   事实上,近年来中医界研究古代医案者颇多 。除了用简单统计方法计算出百分比外,还有对古代医案作“数据挖掘”的,有时选择一个对象范围,套用一些挖掘方法或公式,挖掘出一些关联,论文就写成了 。遗憾的是,这种研究方法很容易走上歧途 。  为了说清楚这个问题,我们先要回顾一下古代医案是如何形成的 。  古代,医生属百工之一,也就是说,医生和其他各个行业的从业者一样,都只是一个社会行当而已 。这些行当在履行行业职能时,只要做好日常工作就可以了 。作为各种行当之一,医生在从事自己的行当时,也没有任何自我的或社会的特別要求,为自己日常的基本工作书写记录性质的医案 。依照这个道理,医案在古代本来不一定会发生 。  现在公认最早的医案,是司马迁在《史记·扁鹊仓公列传》中保留下来的淳于意二十五则医案 。该传中,淳于意对于自己记写医案一事曾有解释,是因为随师学业“方适成”,老师就去世了 。为了提高临证水平,淳于意在临证时就常作记录,以便事后能够与老师所传理论知识作比照 。后来,汉文帝因故诏问淳于意的诊疗能力,淳于意在自己所记医案中摘抄了一部分写成奏章呈献汉文帝,这部分内容又被司马迁编入了《史记》 。这样,才有了第一批医案的传世 。可见,这批医案的形成与传世其实属于偶然事件 。  因为不觉得有什么必要性,其后很多年,很少再有医家有意识地撰写医案 。只是在史书或《千金要方》这类方书中偶有医疗案例的零星且不完整的记载 。  直到宋代,这种情况才开始变化,医案记载逐步增多,医案专著应运而生 。许叔微以案立名方式编著的《伤寒九十论》被公认为我国第一部医案专著 。作者选择自己临证治疗的90例医案,结合《内经》、《伤寒论》及自己的临证经验加以讨论评述 。其医案多数记载完整,辨证准确,方药规范,疗效明显,每多新见 。而比《伤寒九十论》更早问世的宋代钱乙的《小儿药证直诀》,也附有23则医案,采用以证类案的方式分析病因病机,阐述证治方药,是为最早的专科医案 。在此之后,金元时期许多医书如张子和的《儒门事亲》、李东垣的《脾胃论》和《兰室秘藏》、朱丹溪的《丹溪心法》、王好古的《阴证略例》、罗天益的《卫生宝鉴》和滑寿的《十四经发挥》等书中都附有医案 。到明清两代,医家撰写医案更为流行,医案格式规范也引起了注意,医案编集的品种也呈现多样化(在个人专集之外,有多人合集,医案类编等) 。可以看出,宋代以后,医家书写医案的主动意识明显增强 。  古代医家希望借医案证明自己   那么,宋以后的医家为什么会写医案呢?不难发现,医家希望借医案证明自己——证明自己的理论认识或理论阐释的正确性,证明自己的临证水平 。后世有些编纂他人医案的著作,则带有推荐、导学的用意,在一定程度上依然有“证明”的意识——证明被编入者的水平之高,同时证明编者的鉴赏能力 。  绝大多数古代医家保留下来的医案都为数不多,很多医家传世医案只有几则、几十则,个人医案案例数达数百上千者委实不多 。主要原因是古代医家没有为他们看过的所有病例作全面记录,而只是为一小部分他们有兴趣的病例写过医案 。如前所说,只是为能够对他们有证明作用的病例写医案 。那么,他们会认为哪样的病例能对他们有证明作用呢?无疑,一定是病情复杂、难以明判、众说纷纭,惟独主事医家于纷繁之中拨开云雾,21nx.com别具慧眼,提出不同主张,并且最终被证明为正确诊断者 。谁都会诊、会治的常规病情,对作者没有证明意义,作者就不会为此记写医案 。概括起来说,古代医家记写医案的基本标准是:记难不记易,记变不记常 。作为后学,我们能够从古代医案中学习的,也只能是复杂多变的病情下辨证施治的方法,而不是常规的诊疗 。也就是说,学难不学易,学变不学常 。  而现代病历,不论是西医病历还是中医病历,都是基于现代科技档案意识而形成的 。它是现代临床的完整实录,要求客观记写,程式固定,要素完整(包括既往病史、现病史、主诉、体格检查、辅助检查、诊断印象、治疗方案等) 。重要的是不论病情难易,每病必记,每诊必记 。  对比之下我们可以看出,古代医案与现代病历是不同质的样本 。现代病历由于是完全样本,因此,可以对其采用数据研究方式 。由于“总体”是完整的,不论是小样本抽样研究还是大样本抽样研究乃至于全部样本的大数据研究,都是符合数据研究的基本原理的 。而古代医案则不同,它在当初记录时就不是完全地忠实记写,而是基于特别的角度作出的选择性记录,因而,把这样的样本拿来作为一般性样本对待,在统计学角度来说,是犯着多重错误的 。  古代医案记录的病情   具有逆向提示意义   如前所说,因为古代病案形成的背景因素所限,通常我们看不到所选医案代表的“总体”,只能看到“样本”,而这些样本的形成又不是总体中随机抽取的,而是记录者选择记录和保留的,因而,这部分“样本”并不是“总体”的代表,不可能真实反映“总体”的情况 。而且,以古代医案作研究对象,通常样本数量也明显不够,也不能满足统计学的要求 。有些科研设计中,还把古人的医案和现代的病历混同在一起作数据分析,由于二者是不同质样本,这样的混同更是错误的设计 。  事实上,由于古人“记难不记易、记变不记常”的选择标准,我们可以推导出这样的结论:在很多情况下,古代医案中记写得多的,正是古代少见的;而古代医案中记写得少甚至根本不见的,才是古代多见的 。也就是说,古代医案记录的病情在统计学上往往具有逆向提示意义 。把这样具有逆向意义的样本当作普通样本来作数据统计研究,势必得出与实际情况极度不同甚至是相反的结论 。  正因为如此,本文开头给研究生提的问题其答案应该是:该书中血证医案以虚寒性出血病人为多,恰恰提示着,在那些医案对应的年代,也是实热性出血病人为多 。  同理,如果用这样的特殊样本作数据挖掘,挖掘出的结果也只能是医者针对一部分特殊病人、特殊病情的临证状态,而得不出医者在更多、更普通的临证实践中的真实诊断、治疗特点 。  因此对古代医案用数据统计方式或数据挖掘方式研究,容易忽略了古代医案与现代病历性质的差别,研究思路是错误的 。除非作者的研究设计并不把古代医案作为普通意义上的样本,而是明确地就是想研究那些病案所能反映的范围的情况 。例如,用古代血证的医案明确就只研究(包括挖掘)古代对虚寒性出血病人的诊治经验,而不涉及医案中未能反映的其他病机出血病人 。在作这样的严格规定的情况下,数据统计或数据挖掘或能呈现相对正确的研究结果 。【古医案研究慎用数据统计】

推荐阅读