搜索在大数据的噪声信号强

扎克麦考
扎克麦考

扎克麦考博士'19,正在开发的统计工具来推进研究复杂疾病的遗传基础。

5月28日,2019 - 里面的英格兰曼彻斯特郊外的一个不起眼的工厂,位于在线免费提供全球认可的研究数据的一个诱人的宝库。在那里,从超过500,000名志愿者生物样本存储在一个巨大的冷冻机,和服务器的阵列保持兆兆字节的价值的参与者匿名的基因组和详细的临床数据。由于 英国生物库 在2017年开张营业,数千名研究人员已经使用的数据发射的研究,很多集中在寻找 遗传 与复杂的性状和疾病相关的变体。但它可以在数据的茫茫人海中真的协会和虚假的发现来区分一个挑战。哈佛T.H。公共卫生学生萨克利麦考瓒学校正在努力使工作更容易。

他的博士论文,麦考林,谁是这个月毕业并获得博士学位 生物统计学,使用英国生物库的数据来确定的数学运算的特定类型(称为逆正常转化)是否能帮助研究人员更可靠地识别与肺功能相关的基因组中的位置。在第二篇论文项目,麦考林提出了一个方法来填补数据难以通过借用,很容易衡量,在这种情况下,替代数据信息来衡量差距,在血液中替身的基因表达的基因表达大脑。这些项目的目标是帮助遗传变异体可能最终导致更好的诊断程序和靶向治疗研究。

“我希望我的方法将通过对全基因组关联分析工作的其他研究者通过,”麦考说。他希望继续在有趣的统计问题的工作,“当我能够提出有效的新的解决方案,与更广泛的社区分享它们。”

解决问题

麦考林第一产生了兴趣,统计遗传学,当他在北卡罗来纳州成长起来。他的母亲,临床化学家,对新生儿的代谢紊乱,以及对她的工作共享的故事进行筛选试验。作为北卡罗莱纳大学教堂山分校的本科,他在生命的第一年和贡献者儿童哮喘和其他呼吸系统问题上的合作研究,呼吸道合胞病毒,住院的主要原因的基因特征。

最近,他已经成为感兴趣的生存数据分析,比较健康结果的患者在不同的治疗和安慰剂的临床试验。它得到了他在思考新领域统计遗传学,如检查为个人护理应对方式的遗传基础的追求。

麦考说,他在哈佛禅宗时间求解使他成为一个更好的问题,这让他铭记看到研究作为一个反复的过程,找出问题和方法来解决这些问题,往往业绩评估,并作出改善的重要性。 “我了解到,新方法的工作很少通过预期的第一时间,你几乎总是从多轮实验和修改中受益,”他说。

他的论文顾问 林希虹,生物统计学和统计的教授,称赞他的跨学科研究的技能。 “扎克在开发和应用新的可扩展的统计和计算方法在生物银行分析大规模基因组,exposome和phenome数据方面表现出色,”她说。 “这是真正能与他共事的荣幸。”

在学校里,麦考林收到了约翰·F·支持。和弗吉尼亚州湾塔普林养老的生物统计学。他还获得了F31个人研究奖学金由国家心脏肺和血液研究所。

毕业后,麦考林将努力在今年夏天在 Broad研究所 在精细定位,或确定其在基因组区域的许多基因变异的问题是影响健康结果真正负责。今年秋天,麦考将加入谷歌的数据科学家,他的重点领域之一将开发从纵向数据的因果推论。但他认为自己最终会回到学术界,在涉及两种生物医学研究和教学的作用。

麦考担任生物统计学系的助教班,并与学校的 生姜 倡议,非洲的医生和研究人员神经遗传学的培训方案。麦考花了两个星期在南非帮助教生物统计学到该程序的研究员。他说,他喜欢开发课程的问题,并通过解决这些问题的过程中,帮助指导学生。

当他准备毕业,麦考林回忆说,他在学校的经历是不是所有的运算数据。一个热心的运动员,麦考喜欢玩的生物统计学校内足球队和排球队并在当地赛跑从节目的朋友竞争。 “我非常享受我在读研究生的时候,”麦考说。 “经验是具有挑战性的,但形成性和绝对值得的时间和精力的投入。”

艾米勒德

照片:萨拉·肖尔斯