网站地图 | 联系我们 | English | 意见反馈 | 主任信箱
 
首页 中心概况 新闻动态 科研进展 交流合作 人才培养 研究队伍 人才招聘 政策规章 数学交叉科学传播
学术报告
现在位置:首页 > 学术报告

一个高效可扩展的序列数据特征提取平台
【2017.11.22 4:00pm, S309】

【打印】【关闭】

 2017-11-20 

  Colloquia & Seminars 

  Speaker

杜朴风 副教授, 天津大学

  Title

UltraPse: 一个高效可扩展的序列数据特征提取平台

  Time

2017.11.22 16:00-17:00

  Venue

S309

  Abstract

面对海量的生物序列数据,要采用机器学习方法对其进行分析,并从中挖掘分子功能和细胞属性的相关信息,很重要的一个步骤是从这些序列中提起有效的特征,并用数值向量来进行表示,以便多数机器学习算法使用。如何将长度不一的序列表示成维度一致的数值向量,并在这以过程中尽量确保序列信息不丢失以及提取出有用的信息,是一个很重要的问题。过去若干年里,已经有很多相关研究提出了各种不同的算法以及相关软件。然而,每次一个新的算法被发布出来的时候,就必须要开发一个新的软件。这些软件虽然都能正确实现相关算法,但在技术层面上,效率和质量参差不齐。这对于相关算法性能的比较和分析造成了一定的困难。为了解决这一问题,我们提出了UltraPse平台软件。这一平台软件的作用并非是生成各种序列特征,而是为开发序列特征表示算法提供一个基础的通用的高效率的平台,用以简化在实现算法过程中的程序设计与编写工作。通过允许用户对生物序列类型,序列表示算法和理化特性数据进行自定义,UltraPse应该能够在绝大多数的算法实现工作中节省工作量,并大幅度提高计算效率。UltraPse可以在以下GitHub仓库中下载: https://github.com/pufengdu/UltraPse.  

  Affiliation

 

欢迎访问国家数学与交叉科学中心 
地址:北京海淀区中关村东路55号 邮编:100190 电话: 86-10-62613242 Fax: 86-10-62616840 邮箱: ncmis@amss.ac.cn