3月19日,国际学术期刊Bioinformatics 在线发表了中国科学院上海生命科学研究院生物化学与细胞生物学研究所系统生物学重点实验室陈洛南研究组题为Detecting critical state before phase transition of complex biological systems by hidden Markov model 的最新研究成果。该成果展示了通过分析时序列生物数据,建立生物过程相应的隐马尔科夫模型,同时利用机器学习算法对复杂生物系统动态发展过程中的状态临界迁移进行预警的新方法。
基于数据进行复杂系统临界变化的预测一直是生命科学、环境科学、金融学等领域的研究热点,大数据时代的来临更为开发稳定、有效、能够标识临界状态的标志物带来了新的手段和可能。然而,现实的复杂系统往往具有如下特点:一是容易受到外界噪声的干扰;二是在系统真正到达临界点前不会表现出明显的表型或特征;三是个体差异的普遍存在使得科学家很难找到普适的生物标志物。因此,如何利用个体的时序列动态信息,准确预测系统状态发生迁移的临界点,已经成为一个极具科研价值和现实意义的研究热点。
针对复杂生物过程的时序列数据,陈洛南研究组与华南理工大学刘锐研究组合作开发了一套新的数据处理和分析方法,即:利用隐马尔科夫模型对数据进行分段刻画。具体来说,他们根据生物过程发生状态的动态转移特点,把生物动态过程划分成三个阶段:转移前状态、临界状态和转移后状态,并把转移前状态和转移后状态这两个稳定状态看作是平稳的马尔科夫过程(stationary Markov process),把临界状态看作是一个时变的马尔科夫过程(time-varying Markov process),于是把探测将要发生的临界现象转化成探测转移前状态这个平稳马尔科夫过程的终点。该方法利用的是机器学习中的非监督学习方法,具有效率高、稳定性强和仅依赖于个体的动态数据等优势,并能准确捕捉到系统发生状态变化的预警信号。该方法成功应用在三组生物数据上,成功预警了小鼠肺部急性伤害的临界期、MCF-7乳腺癌的临界期以及肝部肿瘤的临界期。
该研究得到了中国科学院和国家自然科学基金委的经费支持。
运用马尔科夫模型预测生物系统临界状态
标签:
相关资讯