基因科技

众所周知,基因与人类健康紧密相关,诺贝尔奖获得者利根川进说:“除了外伤,一切疾病都与基因有关”。2003年,当人类第一次完成全基因组测序(即“人类基因组计划”HGP)时,耗时13年花费38亿美元,如今随着基因测序技术的快速发展,测序成本得以降低,已经逐渐走入普通人的生活,人类对自身基因的认知不再是遥不可及的梦想。从个体到群体,生和死的一线之隔,基因科技只是展现出一点点力量,就足以令世人震撼!

2003年,华盛顿大学博士卢卡斯•沃特曼Lukas Wartman)被确诊患有白血病时年仅25岁,这位研究癌症的医学院学生被迫离开校园。此后,他经过化疗、骨髓移植等多种治理手段后,却依然未能阻挡病魔的脚步。2011年,病情第三次发作且迅速恶化,就在此时,他在华盛顿大学基因组研究中心的同事们施以援手,将他纳入一项研究项目。接下来的几周,经过基因测序仪器和超级计算机昼夜不停的运行,奇迹终于发生了,研究团队发现了刺激他癌细胞快速生长的原因,并找到可抑制这一现象的药物,终于把他从生死线上拉了回来。

2004年,苹果公司创始人之一史蒂夫·乔布斯Steve Jobs确诊为胰腺癌之后,医生曾断言活过1年的几率不足10%。此后,他花费了约10万美元进行基因测序,通过基因测序对他的全部基因和肿瘤组织解读,了解其肿瘤发生的独特基因和分子特征。此后,医疗团队为他重新制治疗方案选择特定药物,降低细胞癌变分子的活动频率,让他成功的延续了7年的生命。假如乔布斯能够早一些进行基因测序,或许我们将不会再为这位巨人倏若流星的陨落而怅然叹惋。

2006年Google创始人之一谢尔盖·布林Sergey Brin)通过基因测序确认自己的基因携带着与母亲同样的“LRRK2”突变基因,携带这种基因使患帕金森氏综合症的概率55%-75%。鉴于基因测序报告显示出的结果,他开始改变自己的生活方式每天坚持身体锻炼和饮用绿茶,同时配合一些药物治疗,成功的将自己罹患帕金森的概率降低到了10%。

2013年,美国好莱坞影星安吉丽娜·朱莉(Angelina Jolie Voight)做了基因检测。检测结果显示她身体里有一个缺陷基因BRCA1,这个基因将使她患乳腺癌的几率为87%,患卵巢癌的几率为50%。之后,她果断的选择了切除乳腺和卵巢,从而避免了患癌症的风险。

环顾我们的身边,每个家庭在迎接新生命到来时都充满了喜悦,然而却有一些家庭因为新生儿的降临陷入巨大的痛苦之中,这些不幸的孩子在出生时就患有先天畸形或智力障碍,病痛和残疾将伴随其一生,甚至死亡也会随时降临。根据世界卫生组织统计,全球低收入国家的出生缺陷发生率为6.42%,中等收入国家为5.57%,高收入国家为4.72%。目前,已知的出生缺陷超过8000种,主要原因是基因突变遗传因素。正因如此,出生缺陷已成为世界各国都非常关注的重大公共卫生问题。降低出生缺陷率,从基因这个源头进行有效干预,已引起全球科学家和公共卫生组织的广泛关注。目前,无创产前DNA检测(Non-invasive Prenatal Testing)技术已进入临床服务,这种检测技术只需采取孕妇静脉血,利用新一代DNA测序技术对母体外周血浆中的游离DNA片段(包含胎儿游离DNA)进行测序,然后将测序结果进行数据分析,检测出胎儿是否罹患三大染色体疾病唐氏综合征(T21)、爱德华氏综合征(T18)、帕陶氏综合征(T13))与传统的检测技术相比,无创DNA产前检测的无创伤性可以避免因为侵入性诊断带来的流产和感染风险。根据各国临床试验数据显示,该技术对于胎儿的三大染色体疾病的检出率均在90%以上,已经在全球90多个国家得到广泛应用

再环顾我们的世界,全球近百个国家已经跨入老龄社会,老龄化社会的到来也伴随着癌症、痛风、糖尿病、帕金森、阿兹海默症、心血管疾病等慢性疾病概率的上升。世界卫生组织有关全球疾病状况的最新评估报告指出,糖尿病、癌症、心血管疾病是当前导致人类死亡的三大主要原因。根据世界卫生组织最新统计数据显示,全球每年死于糖尿病人数400万人;死于癌症人数960万人;死于心脑血管疾病人数超过1500万人。目前,基因测序覆盖的从早期筛查、辅助诊断、靶向治疗全流程的精准医疗产业正在逐步形成。而基于基因测序结果衍生的祖源判断遗传病风险评估、慢性疾病预防的健康管理需求也日益被普罗大众所接受,并在全社会快速普及。

什么是基因组学

基因组学是在人类基因组计划的实施影响下逐步形成的一门新兴科学,是以分子生物学技术、电子计算机技术和信息网络技术为手段,以生物体内基因组的全部基因为研究对象,从整体水平上研究全基因组在生命活动的作用及其内在规律和内外环境影响机制的科学。基因组学是从全基因组的整体水平而不是单个基因水平,研究生命信息的复杂系统,从而认识生命活动的规律,更接近生物的本质和全貌基因组研究应该包括两方面的内容以全基因组测序为目标的结构基因组学(structural genomics)和以基因功能鉴定为目标的功能基因组学(functional genomics),形成系统生物学的重要方法,通过对全基因组数据和功能基因组数据进行定点生物信息分析,能为一些复杂疾病提供有效的诊断治疗方法。例如,对诊断为乳腺癌女性"Oncotype DX"的基因组进行定点测试,能用来评估病人乳腺癌复发的危险率以及化疗效果,这有助于医生获得更多的信息并进行个性化治疗基因组学的主要工具和方法包括生物信息学遗传分析基因表达测量和基因功能鉴定基因组学以基因测序为基础,重点关注基因结构和功能,基因组大数据中揭示生命的奥秘

什么是基因测序

基因测序是一种新型基因检测技术能够从血液或唾液中分析测定基因全序列,预测罹患多种疾病的可能性,个体的行为特征及行为合理。目前,世界上最先进的基因测序技术是基因组测序Whole-Genome Sequencing)可以对一个生物体携带的所有基因信息进行测序,包括所有核染色体上已知基因和未知功能区域的碱基对测序,以及细胞器基因组的碱基对测序,它是分析基因组最全面的方法,能够从完整遗传密码中获得生命信息。相较于一般的基因测序(只对某一个或几个基因或者某一个基因上特定片段、特定位点的碱基对测序),全基因测序能提供高分辨率、精确到逐个碱基的基因组视图,可在最大程度上捕获遗传变异基因,实现一次测序,终生解读的目标。

      在众多病患者当中,80%以上的重大疾病是受到多个基因共同调控的“多基因遗传疾病”,包括癌症、心脑血管疾病、第二型糖尿病、痛风、阿兹海默症、帕金森等重大慢性疾病。“多基因遗传疾病”的成因相对来说更加复杂,通过对全基因数据进行分析能锁定个人病变基因预知罹病风险,从而做到提前预防和治疗

基因数据的广泛应用

展望未来,基因数据的大量存储和在生命健康领域的广泛应用极其重要,尤其是,当基因组学、人工智能、云计算、大数据、区块链为代表的新兴技术相结合时,将会爆发出巨大的能量,基因数据将被广泛地应用在精准医疗、病后康复、健康管理、新药研发等领域基因大数据驱动的生命健康产业将成为创新经济增长引擎,具有无限的发展空间。


基因数据与精准医疗

精准医疗的概念于2011年被美国国家研究委员会提出,2015年,在总统奥巴马(Barack Hussein Obama)的推动下引发全球关注。精准医疗是一种定制医疗模式,又称为个性化医疗,根据个体基因特征、环境以及生活习惯,为病人量身设计出最佳治疗方案,以达到治疗效果最大化和副作用最小化。作为精准医疗的关键,就是通过对大规模人群队列的基因组数据研究,为开展个性化的疾病筛查、诊断、预防、治疗,康复等方面提供有价值的信息。例如:

  • 通过对婚前、孕前、产前的遗传基因筛查与诊断可以分析评估新生儿出生缺陷的风险,从而指导高风险的夫妇优生优育下一代;
  • 通过对健康人群或高风险人群进行癌症早期筛查和慢性疾病患病易感基因风险评估,从而指导人们采取正确的饮食、用药、运动方法,培养良好的生活习惯,对于存有患病风险的人群给予科学的提前预防和精准治疗的指导意见;
  • 通过针对疑似癌症患者和恶性肿瘤确诊患者的基因筛查可分析其癌症在分子医学层面的病因及进展状态,能为肿瘤个性化治疗提供科学依据;
  • 通过对人体微生物核酸测序和筛查可以快速检测出细菌感染和病毒感染,还可以发现未知新病种的细菌和病毒,从而采取有针对性的预防和治疗措施;通过药物基因测序(PGx)检测药物相关生物标记的个体差异,包括分析与药物治疗有关的基因多态性引起的不同反应,指导选择适合药物、用药时间和用药剂量;
  • 通过基因测序伴随临床诊断(CDx)也日趋成熟,受到多个国家临床推荐用于指导治疗癌症靶向药物,随着血液循环肿瘤DNA(CTDNA)无创基因测序、循环肿瘤细胞(CTC)等液体活检技术的发展,其在癌症治疗效果和预后评价及复发监控、康复管理等方面的应用被愈发重视。

基因数据与病后康复

越来越多的研究证实,大多数病患者从在医院接受治疗到出院,只是完成了治疗到康复过程的一部分,基因数据对病后康复计划起着重大作用。例如:

​​​●肿瘤患者在接受临床专业治疗后能否在身体机能恢复、免疫功能重建、恐惧焦虑心理疏导等方面的康复管理,决定了肿瘤患者的生活质量和生存率。通过对肿瘤患者基因数据分析,可以用于为患者提供用药、饮食、运动、生活习惯、心理调节等全方面的康复管理计划。

脑卒中(中风)是当今社会第二大致死原因和第三大致残原因,脑卒中恢复期的康复治疗是基于患者自身神经的可塑性,通过各种手段最大程度地发挥患者自身神经的修复潜能,加速其功能重塑的过程。神经可塑性作为康复治疗的基础和神经修复的内因其评定和功能恢复潜力的预测是精准康复的主要内容之一。


基因数据与健康管理

纵观世界,基因数据早已经和全人类的生命健康产生了千丝万缕的关系。随着人们生活水平不断提高,健康管理服务被世界各国所重视。健康管理服务是一个很大的范畴,理论上可以覆盖全世界每一个人,也就是说医疗服务仅仅是提供给病患者的,那么健康管理服务则是病患者和健康人群都需要的一项普遍性服务。通过对个体的基因数据分析不仅可以为疾病患者提供精准医疗服务,还可以为亚健康和健康人群提供精准健康管理服务。例如

​​●通过个人营养代谢基因分析,可以发现对哪些营养吸收得好,对哪些营养吸收得不好,从而指导人们合理搭配膳食结构;

通过对个人食物不耐受基因分析,可以发现哪些食物可以吃,哪些食物不可以吃,从而指导人们避免因为错吃食物产生疾病甚至导致死亡的风险;

通过对个人体质基因分析,可以发现熬夜和运动的承受能力,从而指导人们如何有效睡眠和快速恢复体力,建立良好的生活习惯;

通过对个人肥胖基因分析,可以发现吃什么容易长胖,吃什么则关系不大,什么样的运动减肥效果好,从而指导人们如何减肥最有效;

通过对个人烟酒损伤基因分析,可以发现酒精和吸烟对身体损伤的程度,从而避免因为摄入酒精和吸烟对人体的伤害;

通过对个人皮肤基因分析,可以发现皮肤弹性指数、皱纹指数、色素指数、发炎指数、抗氧化指数等,从而指导人们选择最有效的美容方式和美容产品;

通过对个人遗传基因分析,可以发现遗传突变基因致病风险,从而指导人们通过改变生活方式和采取有效的预防措施,降低或避免发病的风险;

通过对个人长寿基因分析,可以发现每个人影响寿命的因素有哪些,从而可以采取有效措施延长生命周期。


基因数据与新药研发

科学家通过仪器测量发现,人与人之间有99%以上的基因是相同的,基因的不同是在基因的变异位点上,也就是在某条染色体的某个位置上的氨基酸不同,例如此人是A,而另外一个人可能是B,但它们所编码的蛋白质(或酶)的基本功能是相同的。所以,在新药研发领域,科研工作者通过对异常基因进行大量的数据分析而成功研发出创新药的案例比比皆是。

1959年,美国费城的两位研究员在研究中意外发现慢粒白血病患者的22号染色体比正常人短小很多,这一发现冲击了当时“癌症由病毒引起”的主流观点。此后,研究人员通过对病患者染色体不断研究,最终证实慢粒白血病是由于染色体易位后,9号染色体断点的ABL基因和22号染色体断点的BCR基因结合之后,用于促进细胞分裂的激酶始终处于高活性状态,导致细胞分裂失控,最终引起癌症。在此机理上,通过科学家们反复试验,终于研制出人类第一个白血病靶向药——“格列卫”,对于白血病患者通过“格列卫”抑制BCR-ABL蛋白的活性点达到治疗慢粒白血病的惊人效果。

2015年1月,基因泰克(一家美国生物技术公司)和23andMe(一家美国基因测序公司)达成6000万美元的合作,将3000名帕金森病患者相关的全基因组信息进行共享2017年9月,由基因泰克、23andMe、美国国家老龄化研究所(National Institute on Aging)和数据科学咨询初创企业Data Tecnica International组成的研究团队在《Nature Genetics》上发布了最新成果,通过全基因组关联分析(GWAS)和荟萃分析方法,发现了17个新的帕金森相关的风险基因位点根据世界帕金森病协会的统计数据显示,全球有570万帕金森病患者遭受着这一无法治愈的脑疾之苦尽管有一些药物可暂时缓解帕金森患者的颤抖症状,但仍没有药物可减缓此疾病的恶化进程。而基因泰克技术团队的这一最新发现,很有可能对研发治疗帕金森的药物产生重要影响,一旦该药品上市,或产生十数亿美元的市场规模。

基因科技市场发展前景

基因科技发展的历程,就像一部不断传承的史诗,经过历代科学家们不懈的探索,为解读人类基因“密码”创造了一个又一个奇迹。

1865年,奥地利遗传学家孟德尔(Gregor Johann Mendel)就提出了生物的性状是由遗传因子控制的观点,开创了基因研究的先河;

1909年,丹麦遗传学家约翰逊(Wilhelm Ludwig Johansen)在《精密遗传学原理》一书中正式提出“基因”的概念;

1957年,沃森与克里克(Watson & Crick)提出DNA双螺旋结构,使人们认识了基因的本质,是具有遗传效应的DNA片段;

1986年,美国遗传学家麦库西克(Victor Almon McKusick)提出从整个基因组的层次研究遗传的科学,称为“基因组学”;

1990年10月1日,经美国国会批准美国正式启动人类基因组计划,后来英国、法国、德国、日本和中国等五国科学家相继参与;

1998年,中国组建了中科院遗传所,并在北京成立北方人类基因组中心,完成人类3号染色体短臂上一个约30Mb区域的测序任务,该区域约占人类整个基因组的1%;

2003年4月14日,中、美、英、德、法、日6国科学家共同宣布,人类基因组序列图绘制成功,人类基因组计划的所有目标全部实现,比预设时间提前两年完成,从此拉开了全世界大力发展基因科技的序幕。

进入二十一世纪,基因科技众多经济学家预言为是全球最有发展前景的产业之一并受到全球各国政府重点扶持,基因科技逐渐成为生命经济的支柱产业。围绕基因科技细分的产业非常广泛,它包含了基因测序、基因解码、数据存储基因组学、药物研发、测序仪器、诊断试剂、基因治疗、基因合成、基因编辑、转基因等众多细分行业。目前,在基因科技领域基因测序行业发展速度最快,非常多的技术已经从科研服务进入医疗临床服务,基因测序行业的快速发展将促使基因数据存储及应用行业的兴起,并有利于推动基因组学的进步,继而推动基因科技整体行业的全面爆发。

近年来,基因测序行业市场规模持续扩大,已从2012年的35亿美元增长至2018年的132亿美元,复合增长率20%,预计2020年全球基因测序市场规模可达160亿美元。据预测,未来全球基因测序成本将会进一步下降,但服务规模对比过去五年会有大幅提升,未来五年行业整体增速将维持在18%左右

仅癌症病患者一项数据统计显示,全球平均每8个死亡病例中就有1人死于癌症,2020年全球肿瘤疾病花费预计将超过1500亿美元,预计未来20年全球每年新增癌症病例将达到2200万人,肿瘤疾病花费将超过8000亿美元与此同时,基因测序在肿瘤疾病治疗过程中从早期筛查、分子诊断、伴随诊断、靶向治疗、术后康复的每一个环节都起着极其重要的作用,基因测序仅在肿瘤领域就达千亿美元的市场一触即发。

在全世界范围内,从硅谷到黄金海岸,从东半球到西半球,以基因科技为主导的生命健康产业正在成为极具潜力的蓝海市场。科学家们认为如果有10万个人类全基因组数据信息将成为精准医疗、生物制药、科学研究宝贵资源,并具有难以想象的科研价值。在众多的世界经济发展展望报告中多次提到生命经济,其核心就是基于生命大数据的获取,信息传输和云计算产生的创新经济,以基因大数据驱动的生命健康产业将呈现井喷式爆发,基因科技在10万亿美元生命经济中有着巨大的应用市场

是什么阻碍了基因科技的发展

基因科技虽然带来了生命健康产业的深刻变革,但我们必须清醒的认识到,依然有很多问题需要解决,例如数据主权、数据安全、隐私保护、成本与效率、法律合规等方面,如果这些问题不能得到很好的解决方案,将严重阻碍基因科技发展的进程。


数据确权

在基因科技行业存在着这样较为普遍的现象,个人在接受基因测序公司、医疗机构诊疗和健康管理服务过程中产生的数据,往往会在个人不知情的情况下被用于科研或新药研发。基因数据是每个人最重要的生命信息,本应由数据主体享有数据主权,任何机构组织在使用个人基因数据时,都应该经过数据主体的同意或授权。事实上,大部分机构组织在未得到数据主体同意或授权的情况下使用了数据,或者在一次授权情况下多次使用了数据,作为每一个数据主体很难在完全透明的情况下得知自己的数据被谁使用、用于何种用途,难以维护自己的权利。此外,作为数据主体本应享受因为数据被使用产生的利益分配,但在现实中却很难得到这部分权益。由于个人难以有效维护自己的合法权益,导致大多数人不愿贡献基因数据。然而,基因数据样本的丰富性和全面性是基因科技发展的基础。


数据安全

现有的基因数据存储模式大多是中心化的方式,由数据收集方控制这种方式面临由于单节点系统的网络、硬件故障和安全漏洞带来的风险。个人基因数据和生命健康数据具有高敏感性,一旦发生丢失或泄漏,后果将不堪设想


隐私保护

大部分机构依靠非完全透明的知情同意获得数据授权,或使用去识别化的脱敏匿名数据进行分析应用,但由于没有任何数据加密保护,在数据使用过程中依然可能重新识别出个人信息,还可能被世界上的黑客通过非法技术手段盗取数据,这非常不利于个人数据安全和隐私的保护。


成本与效率

基因测序数据从生成、处理、分析、共享到最终使用的全过程中会涉及大量的数据存储、计算与传输,目前所采用的中心化存储方式共享效率低下,无法支撑未来大规模的数据共享和协作需求。以1TB的数据为例,即使100Mb带宽满负荷运转,也至少需要传输24小时,更何况实际上还达不到这样的理想条件。目前,作为欧盟最大的基因组数据库,欧洲生物信息学研究所(EBI)在2013年的基因数据存储量已超过2PB(1PB=1024TB)。因此,对于基因大数据运算分析的应用需求来看,传输效率本身就是一项艰巨的挑战。

以数据共享为例,通过基于文件的传输协议共享数据,需要大量数据通过互联网下载到本地硬盘才能使用,该过程不但会消耗昂贵的网络带宽成本和存储空间,也会造成过度的数据冗余。另外,按目前中心化存储费用的市场价格计算,全球基因数据每年的存储费用约为10亿美元(冷数据)到200亿美元(热数据)之间,而随着每年基因数据的增加,这笔巨大的费用开支将以几何级增长。


法律合规

人类基因数据,特别是全基因组数据,具有高度敏感性,蕴藏着大量多维度的敏感信息。为此,全球各国政府积极制定了数据保护条例来保护个人基因数据的隐私与安全例如,美国《经济和临床健康信息技术法案》(HITECH)要求数据存储者实施物理、行政与技术解决方案保护生物数据免遭泄漏。欧盟 2018年5月25日起全面实施《一般数据保护条例》(GDPR),这一条例被称为“史上最严数据安全法规”,对数据保护的范围、权利的增强都做了更加严格的规定,最大限度保护个人数据隐私。

在全球范围内,保护个人基因数据和生命数据隐私这一原则已达成共识,但也需要在推动科技进步和伦理道德之间找到平衡点,这将是全球基因科技发展过程中必须面对的挑战。


区块链能解决什么问题

区块链技术是以“机器代码、形式化证明、去中心化、分布式、信息系统”的方式提供了一种机器信任,这种机器信任不再需要借助第三方中心化的组织,在机器信任基础之上,彼此之间即便不认识,人们也可以开展合作与交易。区块链是集分布式系统、点对点传输、共识机制、加密算法、智能合约等技术为一体的组合式创新技术,能够很好地解决激励、效率、成本、安全、合规等问题。另外,在区块链中,每个参与的主体都可以根据其贡献程度获得激励,充分体现价值创造、价值衡量与价值分配,这将为生态的发展产生强大的驱动力。

GTA正是依托区块链强大的技术功能,颠覆了基因科技传统的商业模式,利用密码学技术确认个人基因数据主权,保护个人信息隐私;利用分布式存储技术,实现属地国家去中心化分布式存储;利用隐私可信计算技术向第三方机构组织提供数据运算分析服务,在使用个人基因数据时,确保是在得到数据主体明确授权情况下合法使用;利用点对点传输和云计算技术降低数据传输成本,提高运算效率;利用通证经济激励机制促使大规模的个人用户、市场推广者、基因测序机构、数据存储机构、数据使用机构积极参与和协作,从而快速聚集起大量的基因数据;继而以基因大数据在生命健康领域的广泛应用实现商业价值。

 ​赶时代之脉动,顺经济之潮流,GTA基因链利用区块链技术彻底解决了基因科技发展过程中存在的痛点,凭借创新的商业模式、独特的激励机制将势不可挡地迅速扩大基因数据存储规模,这将为基因科技的快速发展带来全新的希望。