扫一扫
分享文章到微信
扫一扫
关注官方公众号
至顶头条
“我们的工作轰动效应很大,老百姓不明白我们到底是做什么的,但是知道花钱花得很多,其实我们的工作说起来并不复杂。对于生物来说,不管是小到细菌,大到人、植物也好,遗传物质都是DNA,我们所的主要工作就是负责把这些遗传物质的顺序排列解析出来。”中科院北京基因组研究所的胡松年博士在谈及基因所的工作时如是说道。
然而基因测序与我们的日常生活有哪些关联呢?胡松年介绍说,其实基因测序与生活的关联度非常高。比如说亲子鉴定,就是通过父母与子女间的基因相似性来完成的。另外一个让人期待的研究就是个体化药物治疗,“同样的症状,有些人吃牛黄解毒片就能管用,有些人吃同样的剂量可能一点效果都没有,原因就在于人体里面有很多负责代谢药物的酶,由于个体之间的差别,会造成同样一种药物有的人就不吸收,有的人吸收得太快了,没等发挥作用就排出去了,从而呈现出不同的疗效。这种合适或不合适,其实是天生携带来的,可以通过检测这几个主要的酶是什么样的代谢类型,来确定最适合的药物成分。”
高性能计算:必不可少的利器
透过胡松年的娓娓道来,作为生命科学研究的基础性工作,基因测序似乎并不神秘。然而,基因测序毕竟是当前全球的顶尖研究领域,它不仅需要极为精密的测序仪将未知的基因序列解读出来,更重要的是,还要利用高性能计算机对基因进行比较、分析,从而精确的了解到每个基因片段所发挥的作用。“基因所的工作就像战争时期的情报部门,不仅要截获敌方的密码情报,更要利用各种技术手段,将隐藏在杂乱密码中的信息准确的破译出来。”胡松年的形象比喻能够让人更轻松的了解到基因所的工作性质。
因此,在基因所的研究工作中,高性能计算机显然是必不可少的设备。据介绍,目前北京基因组研究所采用了浪潮天梭TS10000刀片集群及存储设备,计算部分采用12台刀片中心,配置了112片刀片,总体的运算速度达到10万亿次/秒;存储部分采用9套48TB的盘阵,达到432TB的总容量,满足海量生物数据存储的需求;网络部分集中了万兆、千兆、Infiniband、FC等多种网络环境构建而成。系统将集群监控软件、生物信息软件、数据库等集成其中,构成高性能生物信息专用集群系统。
谈及为何采用国产厂商浪潮的解决方案时,身为项目负责人的胡松年颇有感慨:“所里决定上设备之后,成立了7人的项目筹备组,并吸引到4家国内外厂商投标。在研讨过所有厂商的解决方案后,我们7个人都觉得浪潮对于我们生物这部分的理解可能针对性感觉更好一些。”
在同行们大都选择国外品牌的情况下,胡松年也坦诚,选择浪潮给他和同事们带来了莫大的压力。“大家买什么你基本就跟着买什么,我们这行就是这样。”不过,正是对当初决定的坚持,也让胡松年得到了出乎意料的回报。
120种应用与“圆桌会议”
事情还要从浪潮中标之后说起。虽然浪潮的解决方案“看似很美”,但还是一个构想,能否把方案变为现实还要看实际的部署情况。然而,在部署刚刚开始的时候,项目组就碰到了第一个难题:怎么把120多种应用部署到一台集群上并能够顺利运行?
120多种应用由于算法、算例以及参数设置等方面的不同,想要统一部署,难度可想而知。“其实,我自己都没想到这套机器到最后实际运算起来的复杂性,比我想象的都要复杂得多。我们一开始准备的是‘一拖四’的方案,但是真的实际做起来的话,根本就不行,‘一拖四’又换成‘一拖二’,后来还是不行,只能换成单对单了。”胡松年苦笑着说道。
当部署工作陷入困境之时,更大的争执爆发了。问题的起因在于基因所建立的“1+1”搭档模式,即一个人做生物研究,另一个做信息技术。但是,数学上“1+1=2”的恒等式在现实中往往不能成立,当两个人的想法“南辕北辙”的时候,1+1最大的可能结果是0。“做生物研究的人不会深入的了解你这个程序的并行是怎么实现的,而搞信息人的则坚持要你讲清楚这个算法是怎么实现的,两个人由于知识构成不同,沟通经常出现问题,。”
这时,时任项目实施总负责人的浪潮集团高性能事业部总经理刘军提出了一个解决办法,“我们的做法是召集项目组成员每周开两次例会,由浪潮的工程师充当‘翻译’,依照问题的重要程度不同,从比重最大的部分开始一项项解决。”随着被戏称为“圆桌会议”的例会定期举行,项目实施中碰到的难题也逐一得到了解决。
在战斗中结下的友谊显然更加深厚,在意识到浪潮工程师的能力之后,胡松年甚至对刘军提出“在我们所里,专门给你们浪潮留了几个位置”,公然动起了“挖墙脚”的心思。同时,胡松年也邀请浪潮参与到基因所的一些重要研究项目中,以解决研究中随时可能碰到的技术问题。
24小时的运维“管家”
在机器部署完成后,基因所的研究工作也步入了快车道。“我们每个月的数据产量有1TB,比以前翻了十几倍,高性能集群基本上处于满负荷运转的状态。”胡松年介绍说,以前一个RUN跑下来要花一星期以上的时间,现在已经缩短到2-3天。
不过,满负荷运转带来的不光是效率的提升,同时也造成了巨大的运维压力,特别是在应用数量达到120多种,用户数量高达几百人的情况下,问题更是难以避免。“还好,浪潮的工程师离得很近,基本上一打电话就到,有一段时间工程师几乎天天都在我们这里。”对于浪潮的服务,胡松年显然非常满意。
比及时的服务更重要的是,针对基因所应用复杂、用户基数大的情况,浪潮还协助基因所建立了完善的集群使用管理条例。“现在我们的学生都必须要学会基本的提交任务格式,如果提交的格式不符合规定,是没办法使用集群跑数据的。”胡松年介绍说。规范的管理模式的建立,大大减轻了基因所的日常维护任务,并充分发挥出集群的效率。
婵犵數濮烽弫鍛婃叏閻戣棄鏋侀柛娑橈攻閸欏繘鏌i幋婵愭綗闁逞屽墮閸婂湱绮嬮幒鏂哄亾閿濆簼绨介柛鏃撶畱椤啴濡堕崱妤€娼戦梺绋款儐閹瑰洭寮诲☉銏″亜闂佸灝顑呮禒鎾⒑缁洘鏉归柛瀣尭椤啴濡堕崱妤€娼戦梺绋款儐閹稿墽妲愰幘鎰佸悑闁告粌鍟抽崥顐⑽旈悩闈涗粶闁哥噥鍋夐悘鎺楁煟閻樺弶绌块悘蹇旂懅缁綁鎮欓悜妯锋嫼閻熸粎澧楃敮鎺撶娴煎瓨鐓曢柟鎯ь嚟濞叉挳鏌熼钘夊姢閻撱倖銇勮箛鎾村櫝闁归攱妞藉濠氬磼濮樺崬顤€闂佸憡顨嗗ú鐔风暦婵傜ǹ唯闁靛/鍕弰濠电姷鏁告慨鎾晝閵堝洠鍋撳鐓庡籍鐎规洩缍€缁犳盯寮崒婊呮濠电姷鏁告慨鎾磹缂佹ɑ娅犳繛鎴欏灪閻撴洟鎮楅敐鍐ㄥ濠碘€茬矙閺屾洟宕惰椤忣厾鈧鍠曠划娆愪繆濮濆矈妲归梺閫炲苯澧悽顖ょ節瀵鎮㈤崗鐓庣檮婵犮垼娉涢敃銉モ枔婵犳碍鈷戦柛婵嗗閻忛亶鏌涢悩宕囧⒌妤犵偛鍟オ浼村醇濠靛牆骞愰梻浣呵归張顒傜矙閹惧箍浜归悗锝庡枟閻撶喖骞栧ǎ顒€鈧倕岣块幇顓犵闁告瑥顥㈤鍫熷仼婵犻潧鐗忛惌娆撴偣閹帒濡芥繛鍫ョ畺濮婃椽宕滈幓鎺嶇凹濠电偛寮堕悧鐘诲箖閳ユ枼妲堥柕蹇ョ磿閸橀亶鏌h箛鏇炰粶濠⒀傜矙閹瞼鈧綆鍋嗙粻楣冩煕椤愩倕鏋戦柛濠冨姈閹便劍绻濋崟顓炵闂佺懓鍢查幊鎰垝閻㈢鍋撻敐搴濈凹闁伙絼鍗冲缁樻媴鐟欏嫬浠╅梺鍛婃煥椤戝鐣烽敓鐘茬闁肩⒈鍓氬▓楣冩⒑闂堟稓绠為柛濠冩礋瀹曟﹢鍩€椤掆偓椤啴濡堕崱妤€顫囬梺绋块瀹曨剟鎯冮鍕拻闁稿本鐟ч崝宥夋倵缁楁稑鎳愰惌娆撴煙鐎电ǹ袥闁稿鎸搁~婵嬫偂鎼达紕鐫勯柣搴ゎ潐濞叉垿宕¢崘鑼殾闁告鍊i悢鍏尖拹闁归偊鍠氬▔鍧楁⒒閸屾瑧绐旀繛浣冲洦鍋嬮柛鈩冪☉缁犵娀骞栧ǎ顒€鐏柛娆忕箲閵囧嫰骞掗崱妞惧闂備礁鐤囬~澶愬垂閸ф鏄ラ柕澶嗘櫅楠炪垺淇婇悙鎻掆挃闁告垼顫夌换婵嬫偨闂堟刀鐐烘煕閵婏附銇濋柡浣割儔閺屟囨嚒閵堝懍娌繛锝呮搐閿曨亝淇婇崼鏇炲窛妞ゆ柨鍚嬮锟犳⒒娴e懙褰掝敄閸涙潙纾归柛锔诲幗瀹曞弶绻涢幋娆忕仼妤犵偑鍨烘穱濠囶敍濠垫劕娈紒鐐緲缁夊綊寮婚敐鍡樺劅闁靛骏绲介ˉ婵嗩渻閵堝繐顩柡浣筋嚙椤曪絿鎷犲顔兼倯闂佸壊鍋掗崑鍛搭敁閸ヮ剚鈷掑ù锝呮啞閸熺偤鏌熼幖浣虹暫鐎规洜澧楅幆鏃堚€﹂幋鐐存珨闂備焦瀵х换鍌炈囨禒瀣瀬闁糕剝銇滈埀顒佸笒椤繈顢楁繝鍌氼潬闂備焦妞块崢浠嬨€冮崱娆愬床婵炴垯鍨圭粻濠氭煛婢跺鐏╅柛鏂惧嵆濮婅櫣绮欏▎鎯у壉闂佸湱鎳撳ú顓烆嚕婵犳碍鏅查柛娑变簼椤秴鈹戦悙鍙夘棡闁告梹娲滄竟鏇㈠箮閼恒儮鎷洪梺鍛婄箓鐎氼厼锕㈤幍顔剧<閻庯綆鍋勯悘鎾煕閳哄啫浠辨鐐差儔閺佸啴鍩€椤掆偓椤斿繐鈹戦崶銉ょ盎闂佸搫娲ㄩ崑鐐哄闯濞差亝鐓冮悹鍥嚋閸旂喓绱掓潏銊﹀磳鐎规洘甯掗埢搴ㄥ箣濠靛棭鐎村┑锛勫亼閸婃垿宕濆畝鍕疇婵せ鍋撴鐐叉閻f繈宕熼銈忕床闂備胶绮崝娆忈缚瑜忕划濠囨晝閸屾稓鍘甸梺绋跨箺閸嬫劙寮冲鈧弻娑㈠棘鐠恒劎鍔梺璇″枤閸嬨倕鐣疯ぐ鎺濇晝闁绘ǹ浜惄搴ㄦ⒒娴e憡璐¢柛搴涘€濆畷褰掓偨閸撳弶鏅滈梺鍐叉惈閹冲繘宕愰崹顐e弿婵妫楁晶缁樹繆閹绘帞绉洪柡灞炬礋瀹曟儼顦叉い蹇e幘閳ь剚顔栭崰鏇犲垝濞嗘劒绻嗘慨婵嗙焾濡插ジ姊洪棃鈺冪シ闁稿骸纾Σ鎰板箻鐎涙ê顎撶紓浣圭☉椤戝懎鈻撻鐐╂斀闁宠棄妫楁禍婵堢磼鐠囪尙澧曟い鏇稻缁绘繂顫濋鐐扮盎缂備胶鍋撴刊鑺ャ仈閹间礁鐤鹃柨婵嗩槹閸嬧剝绻濇繝鍌氭殶閺佸牓姊虹拠鈥虫灍闁挎洏鍨介獮濠囨偐濞茬粯鏅㈤梺绋挎湰缁絿妲愰弻銉︹拺闁告繂瀚峰Σ鎼佹煟濡も偓鐎氭澘鐣峰┑鍥ㄥ劅闁挎繂娲g粭澶愭⒑缂佹ê濮夐柛搴涘€濋幃鈥斥槈閵忊€斥偓鍫曟煟閹邦垱纭剧悮姘舵⒑閸濄儱校闁挎洏鍨藉濠氬焺閸愨晛顎撻梺鑽ゅ枑濠㈡﹢锝為幒妤佸€甸悷娆忓缁€鍫ユ煕閻樺磭澧甸柕鍡曠椤粓鍩€椤掑嫬绠栭柍鍝勬噺閹偞銇勯幇鈺佲偓婵嬪箯婵犳碍鈷掗柛灞捐壘閳ь剙鍢查湁闁搞儜鍛闂佸壊鐓堥崑鍛村矗韫囨稒鐓欓柟顖涙緲琚氶梺鎶芥敱濮婂鍩€椤掆偓缁犲秹宕曢柆宓ュ洭顢涢悙鎻掔€梺绋跨灱閸嬬偤鎮¢姀鈥茬箚妞ゆ牗绮岄惃鎴犵磼鏉堛劌鍝洪柡灞诲妼閳规垿宕遍埡鍌傦妇绱撴担鎻掍壕闁诲函缍嗛崑浣圭濠婂牊鐓涚€广儱鍟俊鍧楁煃閽樺妲圭紒缁樼洴瀹曞ジ鎮㈤搹鍦帨婵犳鍠栭敃銊モ枍閿濆應妲堥柣銏⑶瑰婵囥亜閺傛儳瀚庨柍褜鍓氶崝鏇⑩€旈崘顔嘉ч幖绮光偓鑼嚬婵犵數鍋犵亸娆撳窗閺嵮呮殾婵炲樊浜滈悞鍨亜閹哄秹妾峰ù婊勭矒閺岀喖宕崟顒夋婵炲瓨绮撶粻鏍ь潖濞差亜绠伴幖娣灮閳规稒绻濈喊妯峰亾閾忣偅鎮欓柛妤呬憾閺岀喖鎮ч崼鐔哄嚒缂備緡鍋勭粔褰掑蓟濞戙埄鏁冮柨婵嗘川閻g厧顪冮妶鍡樺鞍婵$偠妫勯~蹇涙惞閸︻厾锛滃┑鈽嗗灠閹碱偊锝炲畝鍕€垫繛鍫濈仢濞呮﹢鏌涢幘瀵告噯闁诲繐鍟村娲川婵犱胶绻侀梺鍝ュУ瀹€绋跨暦閵忋倕绠瑰ù锝呭帨閹锋椽姊洪崨濠冨鞍鐟滄澘鍟粋宥嗙鐎n偆鍘遍柣搴秵娴滄粓顢旈銏$厵妞ゆ梹鏋婚懓鍧楁煛娴gǹ鏆g€规洘甯掗埥澶婎潩椤掆偓缁犵偤姊绘担绛嬪殭闁告垹鏅槐鐐哄幢濞戞ḿ锛涢梺绯曞墲钃辨繛鍛У閵囧嫰骞掗幋婵冨亾閼姐倕顥氬┑鍌氭啞閻撴洟鎮橀悙鎻掆挃闁宠棄顦辩槐鎺戭渻閿曗偓濞诧箓鎮″▎鎾寸厽闁绘柨鎲$欢鍙夈亜韫囷絽寮柡宀€鍠栭幃鈩冩償閵忥絿顢呴梻浣烘嚀瀵爼骞愰崘鑼殾闁绘柨鍚嬮ˉ鍫熺箾閹寸偟鎳勯柣婵撶節濮婂宕掑顑藉亾閹间礁纾瑰瀣捣閻棗銆掑锝呬壕濡ょ姷鍋為悧鐘汇€侀弴銏犖ч柛灞剧煯婢规洖鈹戦鐭亜鐣烽鍕偍閻庣數纭堕崑鎾舵喆閸曨剛顦ョ紓鍌氱Т閿曨亜顕f繝姘耿婵°倕锕ら幃鎴︽⒑閸涘﹣绶遍柛銊ф櫕濡叉劙鏌嗗鍡欏幗闁硅壈鎻槐鏇㈡偩椤撱垺鐓曢幖娣妺閹查箖鎸婂┑鍠㈠綊宕楅崗鑲╃▏缂佺偓宕樺▔鏇㈠焵椤掆偓缁犲秹宕曢柆宓ュ洦瀵肩€涙ê浜楅梺鍝勬储閸ㄦ椽鎮″☉銏$厱闁靛绲介崝姘攽閿涘嫬甯舵い顓″劵椤т線鏌涢妸銈呭祮婵犫偓娓氣偓濮婅櫣绱掑Ο鎾虫贡缁棃顢氶埀顒勩€侀弮鍫濋唶闁绘棁娅i弳銏ゆ⒒閸屾艾鈧兘鎮為敂閿亾缁楁稑鎳忓畷鏌ユ煕鐏炵虎鍤ゆ繛鎴烆焸閺冨牆宸濇い鎾跺Т楠炴帡姊绘担鍛婃儓婵炲眰鍨藉畷鐟懊洪鍛簵闂佸憡鍔︽禍婵嬪窗閹邦厾绡€濠电姴鍊绘晶鏇犵磼閳ь剟宕奸悢绋垮伎濠碘槅鍨辩€笛呮兜妤e啯鐓㈤柛鎰典簻閺嬫盯鏌$仦鐐缂佺粯绋栭ˇ鏌ユ倵濮樺崬鍘寸€规洘鍨挎俊鎼佸煛閸屾瀚肩紓鍌氬€烽悞锕傛晪婵犳鍠栧ú锕傚Φ閸曨垰鍗抽柕濞垮劚缁秹姊虹化鏇熸澓闁搞劏妫勯锝夊箻椤旂⒈娼婇梺鐐藉劜閺嬪ジ宕戦幘缁樺仺闁告稑锕﹂崣鍡椻攽閻樼粯娑ф俊顐n殜閸┾偓妞ゆ帒鍊归崵鈧梺瀹狀嚙缁夌懓鐣烽崼鏇炍╅柨婵嗗閻╁酣姊绘繝搴′簻婵炶濡囩划娆撳箛閺夎法鐤呮俊銈忕到閸燁垶鎮″☉銏″€堕柣鎰版涧娴滃墽绱掗埀顒傗偓锝庡厴閸嬫挾鎲撮崟顒傤槹婵炲瓨绮岄悥濂稿Υ娴e壊娼ㄩ柍褜鍓熼獮鍐閿涘嫰妾繝銏f硾椤﹁鲸寰勯敓锟�