食源性疾病致菌是导致食源性疾病的主要原因,使用数据挖掘、机器学习的方法挖掘食源性疾病因素之间潜在的关联,从而对致病菌进行识别,能够为食源性疾病的诊疗起到辅助作用。课题组提出了一种利用机器学习来识别食源性疾病致病菌的方法,从空间、时间、患者信息、暴露食品等方面提取特征,使用合适的机器学习模型来对特征进行训练和学习,从而对重要的食源性疾病致病菌进行识别,以为食源性疾病的诊疗提供辅助支持。进一步,针对食源性疾病发病情况的时空预测问题,提出了基于多图结构化 LSTM 的时空风险预测模型,该模型能够通过构造多种空间相关性并进行动态融合,利用基于 Encoder-Decoder 的结构化 LSTM 模型同时对数据的时间依赖性和空间依赖性进行建模,实现对疾病风险的多步预测。
食源性疾病时空风险预测模型架构
食源性疾病暴发指发生两例及以上具有共同暴露和症状相似的食源性疾病病例,目前食源性疾病报告监测系统基于筛选规则来发现疑似食源性疾病暴发事件,然而该方法普遍存在误判的现象。为了进一步提高暴发识别和预测的准确性,课题组设计了一种基于机器学习的食源性疾病暴发识别模型。在识别暴发的同时分析了各类特征和致病因素对判别结果的影响,对医学工作者具有借鉴意义。
基于机器学习方法的食源性疾病暴发优化
基于上述系列研究成果,课题组发现大数据与机器学习技术可以在病例报告、疾病诊断、暴发识别和风险预测阶段,极大地改善现有的食源性疾病监控系统,并在此基础上总结了出机器学习驱动的食源性疾病监控系统框架,以促进未来对食源性疾病监测系统做出更智能的改进。(撰稿:张鹏、杜一)