Sunday, February 26, 2017

machine learning来对GWAS结果建模

http://www.mitbbs.com/article_t/Biology/32062879.html

发信人: reallyloveme (ray), 信区: Biology
标  题: machine learning来对GWAS结果建模
发信站: BBS 未名空间站 (Sun Feb 26 20:24:40 2017, 美东)

最近在做一些machine learning/data science的工作。
因为过去做过很多genomics,突然有一个想法,比如GWAS里top candidate的解释很困
难,或者基于top candidate来预测疾病几乎不可能。
那么是不是可以用各种machine learning办法来training比如几万个SNP;得到这几万
个SNP和疾病状态的关系呢?

Y = a1x1 + a2x2 + a3x3 + ....anxn (n = SNP number比如几万个)
比如这种最简单的线性关系,然后来寻找W=(a1,a2,a3,...an)这个vector的最优解

去搜了一下,有一些这样的paper,但并不是很多。大量GWAS data都是online
available的,而用python的机器学习package的运算量,也不会太大吧?反正比我们分
析WGS要小很多吧?所以我觉得每一种疾病的GWAS都可以拿来做modeling,看是否可以
得到good estimate of parameters

但为何看到的文章这么少(或许是我孤陋寡闻)?然后也没有看到有很好的genetics
modeling运用到临床的。是因为这个真正做起来非常复杂?还是有太多arbitrary(比
如使用哪种classifier),所以也是一个坑?

不知道有没有做这个方向的,说说这是不是个坑。



No comments:

Post a Comment