模式菌株(type strains)是在给微生物定名、分类记载和发表时,以纯菌状态所保存的菌种,是微生物分类学的标准参考物质,也是理想的生物技术研究工具,具有重要的科研和产业价值。模式菌株长期以来分散在全球各国超过100余个保藏中心,是各个保藏中心甚为珍贵的资源。2018年,中科院微生物所牵头组织发起了全球模式微生物基因组测序计划,从全球微生物资源保藏中心选择目前未进行测序的模式微生物菌株(包括细菌、古菌和可培养真菌),预计5年内完成超过10,000种的细菌、真菌、古菌模式菌株基因组测序,建立全球微生物模式菌株基因组测序合作网络,现已有来自美国的ATCC、日本JCM和NBRC、韩国的KCTC等超过12个国家的26个微生物资源保藏中心正式加入该计划并形成了重要了阶段性成果。
全球模式微生物基因组数据库分析流程(gcType)
大数据部与中科院微生物研究所马俊才研究员团队合作构建了全球模式微生物基因组数据库(Global Catalogue of Type Strain, gcType),整合了16701个有效发表的原核生物的超过13944个基因组数据,是目前在模式微生物基因组方面数据最为全面,功能最为完善的数据平台,为用户提供一站式的数据管理和基因组注释、新种鉴定等分析,合作成果发表在国际知名学术期刊核酸研究Nucleic Acids Research。
随着全球新冠疫控的持续,新型冠状病毒基因组在流行过程中持续发生变异。迄今,在全球科学技术人员的共同努力下,已经对超过400万例病毒基因组进行了测序,并构建了多个病毒基因组数据库。这些数据库在收集、展示数据的基础上,包含了病毒分型、溯源分析等功能,为全球疫情的监测追踪提供了重要的信息。然而,随着对变异研究的深入,对变异造成的功能影响日渐成为关注的焦点。目前,在全球多个国家和地区均发现了包括Alpha、Beta和Delta在内的多种感染力增强的变异毒株,尤其是关键位点积累的氨基酸变异,极大地改变了病毒的免疫学特征,增加了病毒免疫逃逸的风险,可能会降低现有疫苗、抗体、药物等疫情控制方法的保护性,影响核酸诊断试剂的适用性,对疫情的防控构成了严峻挑战。因此,现有的以收集、展示数据为主的基本数据库已经难以满足未来疫情防控的需求,亟需一个基于大数据的病毒变异风险评估及预警系统,对现有及未来可能出现的各种变异造成的影响进行系统性评估和解读,从而实施更加精准有效的疫情防控策略。
大数据部博士后王京在导师周园春研究员的指导下,以中国多民族传统文化中的海量神话文本为切入点,以知识图谱技术与应用实验室为依托,积极探寻“大数据+人文社科”研究新范式。2020年7月至今,已公开发表《数据视域下的布洛陀学术研究趋势与知识图谱分析》、《中华盘古创世神话田野调查与数据采集》等多项研究成果。目前,初步形成了以多民族神话古籍、口传文本和期刊论文等为数据来源的中国基础神话人物数据近3万条,涉及中国各民族神话文本1.2万个、论文专著5300篇(部)。
2021年9月,王京以“基于多民族神话大数据的中华民族共同体意识研究”为题申请的2021年国家社科基金青年项目成功获批。项目以探索社会科学大数据模式与实践为重点,将围绕非结构化神话文本的数据化解析与重构、神话文本中民族共同体意识关联模型探究、大数据驱动的中华民族共同体意识研究结论的验证与反思、跨学科融合理论及应用场景探索等方面进行创新研究,逐步建立一个中国各民族神话与中华民族共同体意识关联大数据展示与分析平台,更好服务于社会需求。
图1.课题研究对象及研究过程图
新型冠状病毒变异评估和预警系统入口(VarEPS)
大数据部与中科院微生物研究所马俊才研究员等团队合作发布了“新型冠状病毒变异评估和预警系统”(SARS-CoV-2Variations Evaluation and Prewaning System),简称VarEPS数据库。VarEPS是全球首个对SARS-CoV-2基因组已知变异及虚拟变异进行多维度风险评估和预警的系统。VarEPS从基因组学和结构生物学角度入手,在基于变异位点频率评估的基础上,从核苷酸变异发生难易程度、氨基酸替换难度、变异对蛋白质二级结构的影响、单个氨基酸突变引起的ACE2及中和抗体结合自由能变化等参数对变异进行多维度的评估,全面对已知变异和潜在的虚拟变异对病毒的功能造成的影响进行综合分析。在此基础上,该系统采用人工智能分类器算法,将变异株从传播性和对中和抗体亲和力两方面进行有效分组,实现了基于病毒序列的风险评估和预警。合作成果发表在国际知名学术期刊核酸研究Nucleic Acids Research。(撰稿:孟珍)
合作企业
行业和类目
服务响应
垃圾拦截率
连续多年获得网易优秀经销商
一心一意专心致力于企业邮箱
满足企业信息化个性需求
一对一邮箱顾问服务