雷石产业观察 | ChatGPT火了,AI制药能迎来新发展吗?
来源:雷石投资
导语:近年来,AI制药已经成为医疗领域的新晋热门赛道。2023年ChatGPT的爆火,又让人们看到生成式AI在制药领域的新可能。当AI制药的潜能不断被证实,在大势所趋下,AI制药又该如何破局数据之困、监管之难,突破挑战迎来新发展。
ChatGPT火了,AI制药能迎来新发展吗?
从OpenAI发布聊天机器人ChatGPT开始,人工智能的发展又一次驶入快车道。最近一个月,每隔几天人们就能看到人工智能的新进展。无论是行业巨头还是初创公司,都在积极寻求应对新一轮AI风潮的方法,制定相应的AI战略。
ChatGPT的爆火,AI 2.0时代的到来,也给生物制药行业带来新的改变。最近,AI药物研发公司Insilico Medicine(英矽智能)在生成化学领域知名期刊Chemical Science发表文章,阐述了分子生成平台Chemistry42在AIphaFold2蛋白质结构预测的基础上进行分子设计,进而在30天内发现靶向潜在抗癌靶点CDK20的小分子抑制剂的过程,展示了在有限分子结构数据下,人工智能可以辅助新药物发现,实现降本增效。
更早之前,初创公司Profluent首次利用类似ChatGPT的蛋白质工程深度学习语言模型ProGen实现了AI预测蛋白质的合成,并将研究成果发布在《自然》杂志子刊。可以说,AI正在给制药领域带来根本性的改变。Gartner《2022年人工智能技术成熟度曲线》报告称,2025年50%的药物发现与研发将使用生成式AI;2027年,30%的制造商将使用生成式AI提高产品研发效率。随着生成式AI的持续发展,制药领域或许也能迎来全新的发展期。
AI+蛋白质成新的投资热点
ChatGPT走红,势必带动新一波AI投资热潮。事实上,随着近期AI制药话题度的持续走高,一众AI概念股的股价也跟着水涨船高。尽管中国目前还没有真正的AI制药公司,但也不妨碍CRO(医药研发合同外包服务机构)企业成都先导股价在3月一路上涨,数次涨停。成都先导称,公司一直以来都对AI在药物研发领域的进展保持高度关注并不断进行探索和研究,未来会持续加大在该领域的尝试。
在今年3月的复星医药业绩发布会上,董事长吴以芳接受采访时表示,未来将在创新药靶点发现和药物设计等方面进行AI制药业务。
上市公司持续深耕AI制药,初创公司的融资能力也表现不俗。
2月20日,AI蛋白质设计平台公司分子之心宣布获得超亿元战略投资,用于AI蛋白质优化与设计平台MoleculeOS进一步开发,以及在生物制药、合成生物学等产业领域的应用探索。不到一年的时间里,分子之心已经完成2轮融资。
而在国外,资本市场对于AI+蛋白质的投资热情持续高涨。2022年4月,Arzeda宣布完成3300万美元的B轮融资,用于正在进行的蛋白质设计项目。
2022年11月,AI+合成生物初创公司Cradle获得550万欧元的种子轮融资,资金将用于支持公司基于AI设计蛋白质和细胞工厂的研究进程。
2023年1月,Profluent宣布完成900万美元的种子轮融资,该笔融资将用于在加利福尼亚伯克利建立一个综合实验室,使Profluent能够在通过实验方法产生的数据与其AI系统之间创建一个紧密的反馈循环,不断改进公司AI。
资本的投入,将更加有利于企业不断提高AI技术,进一步促进人们对细胞基本结构的理解,进一步推动生物制药过程,从而推动生命科学和医学的发展。
生成式AI颠覆蛋白药物研发
为什么制药公司会看重“AI+蛋白质”领域?因为生物制药主要都是蛋白质,蛋白质类原料是生物医药上游占比最大的原料之一。目前重组蛋白药已经成为生物制药领域最重要的产品之一。
当人们将大量的蛋白质数据提供给AI,AI就可以分析研究这些数据从而创建新的蛋白质。在蛋白质设计过程中,AI可以把原先无序、不规则的氨基酸残基拼接成能够和靶点结合的候选蛋白,从而推进新药物的开发。相比传统实验技术测定蛋白质结构的费时费力,AI强大的算力算法和数据处理能力,能颠覆传统的药物研发,加快药物研发速度。
2017年,《Nature》发表文章称,人类可发现的药物分子个数可能是10的60次方,而传统药物筛选办法能够找到的分子数仅约10的11次方,在11次方与60次方之间有一个远未穷尽的大黑洞,这里或许就潜藏着许多新药的可能性。生成式AI或许是创造可能性的有力工具之一。
生成式AI可以基于训练数据生成算法模型,自主生成各种形式的内容。ChatGPT的出现让人们看到大型语言模型(LLM,Large Language Model)的出色效果。
Profluent的蛋白质工程深度学习语言模型ProGen和ChatGP类似,实现了AI预测蛋白质的合成。据报道,Profluent设计的蛋白质是通常需要数百年才能进化出来的高活性蛋白质。由此可以看出生成式AI同样可以学习生物学的基本原理,可以大大提高蛋白质设计效率。
和ChatGPT一样,ProGen模型的创建也是研究人员喂养了2.8亿种不同蛋白质的氨基酸序列,并经过了几周时间的训练。同样地,ProGen也是通过学习氨基酸如何组合成2.8亿个现有蛋白质的语法,才学会如何生成新的蛋白质。ProGen和ChatGPT一样也是经过大量的数据喂养才能使算法模型越来越精准。
众所周知,新药品的研发是一个周期长、复杂的过程,而且失败率高。而随着生成式AI的发展,可以帮助药企更快地识别和分类小的分子和生物制剂,并且改善临床试验的结果。
图注:使用条件语言模型生成人工蛋白质
AI制药面临的挑战
AI快速发展给制药带来新机遇的同时,挑战也一直存在。首先是数据。早在2019年,《Nature Reviews Drug Discovery》发表的文章就将“获取适当数据集”视为AI药物面临的五大挑战之一。数据首先要面临质量问题,GPT-3的训练数据有很多是来自互联网,导致当时人们感觉ChatGPT在胡言乱语。而药物数据的质量更难以保证。同时,药物数据相较其他数据更为敏感,数据都分散在各大医院,很难被科技公司获取和加以使用,数据孤岛不能打破,AI模型的训练就会差强人意。
其次,和电商、金融、游戏等行业相比,在制药领域,数据的丰富性和多样性相差甚远,使用场景也有限。要知道,只有当数据足够丰富时,AI的落地才会更加顺畅。
最重要的一点是,AI制药还会面临监管问题。ChatGPT的火热已经引起各国政府的注意,相应的监管规则正在不断出炉。路透社报道称,3月31日,意大利个人数据保护局宣布禁用ChatGPT,暂停OpenAI处理意大利人的数据,并对其展开调查。德国、法国、爱尔兰等国家也开始准备加强对ChatGPT监管。我国国家互联网信息办公室起草了《生成式人工智能服务管理方法(征求意见稿)》,向全社会公开征求意见。当野蛮生长的新兴技术遇上监管之手,未来发展将会充满更多不确定性。
值得一提的是,尽管AI制药是大势所趋,但在传统结构生物学家眼里,AI 是未来,但现在仍差强人意。
颜宁曾表示,AI仍有局限性,AI还需要更大的数据库,更强的算力,更新的算法。2013年诺贝尔化学奖获得者迈克尔·莱维特(Michael Levitt)在接受第一财经采访时表示,“我认为很多结构生物学家不仅仅是在做结构方面的研究,他们也做很多蛋白功能以及药物研发方面的工作,就好像颜宁教授。人工智能只是解放了一部分传统的人力,但是科学的进步仍然需要依靠最聪明的人脑,单靠人工智能恐怕还是不行的。”
结语
AI制药领域备受热捧,AI制药创业公司融资额也日益走高,我们可以看到制药业正在热切拥抱AI,寄希望于这一前沿技术,缩短药物研发周期,降低药物研发成本,提高药物研发成功率,创造更大的商业价值以及社会价值。
但现阶段AI制药在技术和政策上面临着诸多挑战,一些传统药企对AI态度复杂,仍持观望态度。AI制药的商业化前景仍需接受市场检验。
但从长远来看,随着AI技术的快速发展,AI制药仍是未来的发展趋势。当制药企业经验不断积累,AI持续优化,AI在制药业发挥的价值将会越来越大,能进一步促进生物科学的发展,让更多普通人受益。这条路道阻且长,但充满想象力。