为了演示数据驱动的可变性方法如何用于识别2001年至2015年间两种英语电子健康记录数据库中疾病记录的变化。
重复的横截面分析,即应用数据驱动的时间可变性方法,以评估常规收集的医疗数据的月份变化。基于年龄,性别,社会经济地位和记录的心血管疾病的联合分布计算了几个月之间的差异。月之间的距离用于识别数据记录中的时间趋势。
来自临床实践研究Datalink(CPRD Gold)和451家医院发作统计数据(HES)的400名医院提供商的英国初级保健实践。
患者(CPRD金)和医院入院(HES)的比例进行了记录的心血管疾病(CPRD GOLD:冠心病,心力衰竭,外周血动脉疾病,中风; HES:I20-I69 / G45的国际疾病代码分类。
两种数据库显示2001年至2008年期间心血管疾病记录的逐步变化。CPRD黄金中含有的心血管疾病的患病率增加了47%-62%,后者在2008年后部分逆转。对于HES的医院记录,有一种相对减少在同一时间段内,心绞痛(-34.4%)和未指明的中风(-42.3%),伴随慢性冠心病(+ 14.3%)。2010年3月/ 4月在2012年3月/ 4月,2012年和2014年4月,可能与临床编码指南的更新有关的多重突然变化。
确定的时间变异性可能与潜在的非医疗原因有关,例如更新的编码指南。这些人为改变可能引入从日常数据推断的诊断之间的时间相关性,违反常用统计方法的假设。时间可变性措施提供了一种客观和强大的技术来识别,随后审议,电子健康记录研究的变化,无需任何先前的数据收集过程。

©作者(或他们的雇主)2020。在CC下允许的重新使用。由BMJ发布。