2021-09-07
医院的电子病历资料是开展真实世界研究(“RWS”)时非常重要的数据来源,无论是治疗判线,AE事件的确认,还是换药原因等等,都需要在病史的字里行间中找寻答案。由于病历资料多为非结构化的文本数据,而这又是机器处理的难点,如何正确的解读医生书写的病历,并获取RWS所需要的信息,接下来,我们试着从医生的角度来告诉大家,病历是如何书写的,医生想表达的重点在哪里,以及需要的数据如何获得。希望能为刚“入行”的小伙伴在今后的病历人工阅读过程中提高效率,同时为病历自然语言处理( Natural Language Processing, NLP)提供一些新的视角与帮助。
肿瘤科病史
本病史为作者根据自身从业经历编写的虚构病例,仅为本文解读病例使用
主诉
确诊左肺癌110个月,发现转移7年。
现病史
患者入院前110个月前(2010.3)体检发现"左肺占位",于外院⑴行左肺占位穿刺,病理示(FC10048)左肺肿物穿刺组织为乳头状腺癌,肺部原发可能性大。免疫组化结果CK7(+),CK20(-),P63(-),TG(-),EGFR(80%+)⑵。(2010.03.30)予术前新辅助化疗2次,方案为"长春瑞滨 40mg d1、d8 ivgtt+顺铂40mg d1-3 ivgtt Q3W"⑶,CEA10.3ng/ml,复查胸部CT示左肺下叶脊柱旁团块影,大小约4.6cm(纵膈窗),部分与邻近左肺门影分界不清,周围可见多发斑片、结节密度增高影,与前大致相仿;左肺上叶见片状、斑片状、蜂窝状影,考虑慢性炎症,与旧片相仿。(2010.04.29)全麻下行"左肺癌根治术",术后病理(病理号201009633)(左全肺):结节性肺腺癌Ⅱ级,侵犯支气管及肺被膜,灶性坏死,淋巴管内见癌栓;支气管断端未见癌浸润,找到肺门淋巴结2/6个,及另送(第5组)淋巴结1/2个,(第6组)淋巴结1/5个,(第7组)淋巴结0/5个,(第8组)淋巴结0/1个,(第9组)淋巴结0/1个,(第10组)淋巴结1/4个见癌转移。免疫组化Ki67(20%),P53(+++),GSTn(++),P170(++),EGFR(+),VEGF(+++),ERCC1(++)⑷。术后2个月复查胸片示正常。之后无再跟踪随访。
7年前因"右侧胸痛"复查胸部CT平扫+增强示左侧肺切除术后改变;右肺多发大小不等结节,最大1.1cm,考虑转移瘤。复查脑MRI示左侧额叶中央前回后部皮髓质交界区结节状强化灶,考虑转移瘤。全身骨ECT示右侧第6肋骨近腋前线点状放射性异常浓聚,考虑创伤后改变;左侧第4肋骨近腋侧及左第6后肋今肩胛骨脊柱缘轻度点状放射性异常浓聚⑸。2011.05.17予"培美曲塞0.8g ivgttd1+顺铂40mgd2-d3、30mgd4ivgtt"Q3W联合恩度化疗,因不耐受消化道反应,后改用"培美曲塞0.8g ivgtt d1+卡铂0.2g d2-d4"Q3W行第2周期一线姑息化疗,化疗2周期后复查头颅MRI示左侧额叶中央前回后部皮髓质交界区结节状强化灶,考虑转移瘤,大小约0.4*0.4cm,较前减小。胸部CT增强+平扫示原右肺多发转移,大小约0.7cm,较前缩小。CEA、CA125正常。疗效评价PR。此后继续予“培美曲赛0.8g ivgtt d1+顺铂40mg d2-3、30mg d4 ivgtt”化疗2个周期(末次化疗时间:2012.08.03)⑹,化疗过程中出现III度消化道反应,予加强止吐治疗。出院后自服用中药治疗,无再化疗。定期复查(2011.12 .23)胸部CT示肺多发转移,最大1.0cm。脑MRI未见病灶增大。
6年前(2012.4)复查胸部CT示右肺多发转移灶,大小约1.5cm,较2011.12.23稍增大,右肾上腺增粗,较旧片明显,考虑转移瘤。CEA升高至21.8ng/ml。脑MRI未见异常。按RECIST标准评价PD。(2012.4.17)改予"多西他赛120mg ivgtt Q3w"二线姑息化疗1个周期,化疗过程尚顺利,出院后监测CEA升高至47.8ng/ml⑺。患者自行改为口服TKI类药物,且不规则口服,未监测随访。门诊复查胸部CT平扫+增强:左肺术后改变,左侧胸廓塌陷,左侧胸膜增厚并少量胸腔积液,纵隔左移;右肺多发转移瘤,较前有所增大;所摄入右侧肾上腺结节,考虑为转移瘤。全身骨显像:相当于左侧第6后肋近肩胛骨脊柱缘轻度点状放射性异常浓聚,与旧片对比放射性浓聚程度稍减低;原右侧第6后肋骨近腋段及左侧第4肋骨近腋段放射性异常浓聚灶消失。疗效评价PD。⑻建议化疗,但患者拒绝,要求出院。出院后仍自行间断口服TKI药物。
3年前返院查颅脑MRI平扫+增强:1、轻度脑腔隙,轻度脑萎缩。2、轻度部分鼻窦炎。胸腹部CT平扫+增强:与2014.02.28片比较:1、左肺术后改变,左侧胸廓塌陷,左侧胸膜增厚并少量胸腔积液,纵隔左移,较前相仿。2、右肺多发转移瘤,较前明显增大。3、所摄入右侧肾上腺转移瘤,较前增大。疗效评价PD。于2015.05.21开始姑息四线“紫杉醇(白蛋白结合型)400mg 静滴 D1”Q3W方案化疗2周期,患者出现脱发,乏力,轻度肝功能异常,遂自行停止化疗⑼。
2016-06-28 在超声引导下行经皮穿刺腹腔肿物粗针活检术,病理回报(201622381):(腹腔肿物,穿刺活检):送检纤维组织中见中分化腺癌浸润,部分为微乳头状癌,结合临床病史、形态学及免疫组化结果,考虑来源于肺。免疫组化结果:肿瘤细胞示CK7(+),EMA(+),Ki67(10%),TTF-1(+),P63(-),CK20(-)。后自行前往美国进一步治疗,2016-06至2018-11予口服奥西替尼治疗,复查胸部CT提示肺PD⑽;2018-12开始PD-1免疫治疗,Q2W治疗(具体剂量不详);2019-01出现饥饿感、食欲不振,考虑甲亢,予药物治疗(具体不详)后,出现皮疹,完善甲功(2019-03-16):TSH 10.7mIU/L, FT3 2.77pmol/L,TRAB<0.3U/L。考虑甲状腺功能减退症。近期出现恶心、呕吐症状明显,呕吐为泡沫样口水样物质,予药物治疗上上述症状好转⑾。2019-05-16予“西妥昔单抗700mg d1 ivgtt Q3W”+ 埃克替尼 0.125g 口服 TID + 安罗替尼 8mg口服 QD” ⑿。现为进一步治疗,就诊我院,门诊拟"左肺腺癌术后多发转移"收住入院。近来,精神、睡眠正常,食欲较上次入院前好转,大小便如常,体重无明显变化。
既往史
既往体健。否认肝炎、结核、疟疾病史,否认高血压、心脏病史,否认糖尿病、脑血管疾病、精神疾病史,否认手术、外伤史,否认输血史,否认食物、药物过敏史,预防接种史不详。⒀
个人史
生于***省**市,久居本地,无疫区、疫情、疫水接触史,无牧区、矿山、高氟区、低碘区居住史无化学性物质、放射性物质、有毒物质接触史,无吸毒史,无吸烟、饮酒史⒁
婚育史
适龄结婚,育有3女,配偶及子女体健。
家族史
父母已故(死因不详)。母亲患“高血压病”。兄弟姐妹健康。否认家族中有类似病史。否认"糖尿病、血友病、精神分裂症"等遗传或遗传倾向病史。否认恶性肿瘤家族史。⒂
01
一份合格的现病史都会从本次疾病的最初一次发病开始记述,无论是在本院治疗还是在外院治疗。因此确切的首诊日期往往可以从现病史的第一句获得。而目前机器判读的首诊日期为在本院的第一次就诊。
02
在外院的检查治疗,医生往往会选择最关键的信息记录,包括病理检查,免疫组化,治疗用药等等,有时候这些确诊信息(比如基因突变等)在之后的治疗中将不再重复做,而这些信息在本院的数据库中又是缺失的,因此只能通过文本阅读获得。
03
对于疾病的历次治疗,医生会按时间顺序从最早一次开始记录治疗过程。而且一份合格病历会在每一次住院的现病史重复这样记录(大多数时候复制黏贴),因此最后一次的入院记录相对会是最完整的一份治疗记录:从第一次到最近一次用药及治疗过程。这对我们治疗判线工作尤为重要。这里医生对新辅助治疗做了详尽描述,用药时间,药物类型,剂量,几个周期,这些描述可以和发药清单中倒推出的方案和用药剂量做相互印证(实际取数时,常发生药物漏抓的情况)。
04
关于最为重要的手术信息,医生会着重描述,当手术发生在外院时,这些记录就尤为重要。哪一天做的手术?手术类型是根治还是姑息(这直接关系到药物治疗的判线)?术中所见,术后病理结果(有些医生会明确写出TNM分期,如没有我们需要通过手术病理的描述去回填TNM分期)免疫组化结果,有无基因突变?这些都是和我们研究密切相关的信息,同时也是机器NLP处理的难点。
05
病史都为倒叙,这里医生记录了第一次发现疾病复发的情况,几时发现的,做了哪些检查发现的,这些可以算基线信息,后续治疗效果都需要和基线比较。比如前一次没有肾上腺转移的表现,后面新出现的就是pd。
06
确定发生转移,进行了哪些治疗,医生在这里详细描述了一线治疗的情况,包括哪天开始,用了什么药,发生不良反应后换了哪种药,最后效果如何(pr)。这里我们看到患者的方案从顺铂换成卡铂,再换回顺铂,医生仍然算作同一线的治疗。因为同一类型药物(铂类之间)互换不算做换线。同样的还包括紫杉类家族,5-fu类家族等等。
07
又过了一年,复查发现疾病pd,因为肾上腺出现了新的病灶,如果这里医生没有明确写pd,但通过对肾上腺的描述我们需要自行判断pd。于是换2线多西他赛治疗。
08
患者自行在院外换药治疗,进行了3线TKi治疗,这些信息明显在本院数据库缺失,只能从文本获得。
09
2015年复查,疾病进展,患者进行了4线白蛋白紫杉醇治疗。这里我们发现虽然白蛋白紫杉醇和多西他赛同为紫杉类药物,但两个方案间隔超过半年以上,中间还进行了一线TKi治疗,所以这两个紫杉类用药属于不同的治疗线。
10
2016年患者做了腹腔穿刺,同时去美国治疗,进行了5线奥西替尼治疗。这里我们又一次靠医生的文本信息补全了本院数据库的缺失。(Tips:奥西替尼作为三代TKi,一代TKi换成三代TKi也算换线治疗的)
11
2018年患者开始6线免疫治疗,这里除了用药剂量,医生描述了免疫治疗的不良反应,免疫性甲状腺损伤。关于AE一直是RWS药物研究的一个重要领域,而它也恰恰是技术上的一个难点,我们通过诊断很难完整的抓到AE,大部分不良反应还是会被记录在病史文本信息,这就需要大量的人工阅读工作。
12
2019年,患者开始7线治疗。
13
既往史往往记录与本次疾病并不密切相关的合并症,比如心脏病,糖尿病等。关于合并症的信息往往在这里可以找到。
14
个人史最主要的信息就是吸烟史和饮酒史,可惜很多时候医生记录的相当随意,导致这部分数据缺失比较严重,绝大部分门诊病历甚至都不写。
15
家族史着重记录的是患者两系(父系和母系两边亲属)三代(患者父辈,同辈及子女三代)的遗传疾病情况。尤其恶性肿瘤的家族遗传史在这里可以找到。
以上是我们对一份现病史的粗略解读,虽然病历的书写枯燥乏味,鲜有文采,甚至就是一篇流水账。但一篇好的“流水账”可以完整的把所有重要的信息按治疗时间顺序原原本本的呈现在研究者面前,使我们快速的获得关键数据。作为RWS的研究者,我们需要感谢那些认真书写病历的医生,同时也要学会如何快速的在浩瀚的医疗文本中获取有价值的数据信息。
百度浏览 来源 : RWE智谷
版权声明:本网站所有注明来源“医微客”的文字、图片和音视频资料,版权均属于医微客所有,非经授权,任何媒体、网站或个人不得转载,授权转载时须注明来源:”医微客”。本网所有转载文章系出于传递更多信息之目的,且明确注明来源和作者,转载仅作观点分享,版权归原作者所有。不希望被转载的媒体或个人可与我们联系,我们将立即进行删除处理。 本站拥有对此声明的最终解释权。
发表评论
注册或登后即可发表评论
登录注册
全部评论(0)