清北、浙大、哈佛……全球高校花式拥抱AIGC
来源:“多知网”(ID:duozhiwang),作者:王上
自ChatGPT横空出世之后,生成式AI技术已经席卷到高校。
近日,清华大学联手字节跳动推出全新开源大语言模型SALMONN,可支持语音、音频以及音乐输入。
8月22日,浙江大学宣布推出多个垂直大模型,包括「智海-三乐」教育垂直大模型、「智海-金磐」垂直金融零售语言大模型等。
据多知网不完全统计,在国内,清华大学、北京大学、北京语言大学、上海交通大学、西北工业大学(或联合企业)推出了大模型,而在国外,哈佛大学的一门编程课程也推出了自研大模型,密歇根大学推出了新的AI平台。
“未来已来”不再是一句畅想,正如可汗学院创始人Sal Khan所预见的那样,“在AI时代,学生拥有AI导师,教师拥有AI助教。”
国内高校“百模齐放”
当前,高校大有“百模齐放”之势。
中国高校的顶流“清北”对新技术自然非常关注。从企业端大模型来看,很多创始人出自清华,如百川智能王小川、澜舟科技周明、小冰公司李笛、面壁智能刘知远等。
而在校园内,清华大学不少团队都在研究大模型,目前由于两个团队做了开源大语言模型。
今年6月,清华大学NLP实验室联合智源研究院成立的开源组织OpenBMB发布了一个最高有100亿参数规模的开源大语言模型CPM-BEE,功能包括文字填空、文本生成、问答等。
清华大学最新和字节跳动合作的又是开源大语言模型,不过SALMONN这个大模型的长处是语音 ,其可支持语音、音频以及音乐输入,他可以感知和理解不同类型的音频内容输入,并具备多语言语音识别和翻译以及语音推理等功能。
在不少从业者看来,通用大模型是通才,对教育领域或者其他特定领域的作用有限,因此,各行各业需有垂类大模型。 就如美国课外辅导在线教育公司Chegg,原本只是应用ChatGPT大模型,现在也在自研教育垂类大模型。在企业之外,高校在垂类大模型方面也走在了前列。
今年7月4日,北京大学联合兔展智能推出了中文法律大模型“ChatLaw”,它可以提供提供对话、写作、知识库三种模式,能给法律小白们答疑解惑、提供法律建议,被网友称为“大模型中的‘罗翔老师’”。
7月13日,上海交通大学重庆人工智能研究院在西部(重庆)科学城正式发布“兆言”大模型,这个是一个针对行业的大模型,“兆言”寓意为“兆文厚积,言出成章”。
根据介绍,“兆言”具有精度高、效率高、成本低三大特点,更好地赋能制造、医疗、金融、文旅、法律、服务等行业领域。
浙江大学也一直关注技术前沿,今年4月,微软亚洲研究院联手浙江大学的研究团队,发布了一个大模型协作系统HuggingGPT,连接HuggingFace社区中的各种AI模型,来完成多模态复杂任务。
今年8月,浙江大学再进一步,推出多个垂类大模型。
浙江大学联合高等教育出版社、阿里云等发布基于通义千问7B(70亿参数)模型训练的「智海-三乐」教育垂直大模型,三乐出自《孟子》“得天下英才而教育之,三乐也”,这是教育一词的起源,寓意重视教育是亘古不变的话题。
根据介绍,浙江大学的智海-三乐教育垂直大模型以阿里云通义千问7B通用模型为基座,基于核心教材、领域论文和学位论文等教科书级高质量语料和专业指令数据集继续预训练和微调。智海-三乐集成了搜索引擎、计算引擎和本地知识库等功能,将于9月在全国13所高校应用,可提供智能问答、试题生成、学习导航、教学评估等能力。
浙江大学人工智能研究所和摸象科技联合研发中国首个垂直金融零售的语言大模型「智海-金磐」大模型,可为金融机构提供高效、智能的语言服务,包括金融知识问答、金融文本生成、金融对话机器人等多种应用场景。
国内唯一以“语言”命名、以传播中国语言文化为主的国际型大学北京语言大学亦是将目光对准了垂类模型,推出了国际中文教育领域的大模型“桃李”(Taoli)1.0。
根据介绍,“桃李”在通用中文基座模型上扩充了国际中文教育领域专有词表,使用了该领域专有数据集进行指令精调,增强了大模型在该领域多项任务上的理解能力。
在功能上,“桃李”可以根据学习者的情况作出反馈,帮助学生模拟真实的语言交际场景;具有文本纠错功能,能够分别进行最小改动纠错与流利提升纠错,并能深入分析错误原因;具有作文评分功能,能够自动对作文水平进行评判,帮助学生自主学习。
此外, “桃李”能够方便国际中文教师整合教学资料,提供教学思路,提升教学质量。例如辅助生成教学过程中需要做的教案、幻灯片中需要展示的例句、课堂需要给学生提供的课外素材等。
还有一些高校大模型进行了预发布,比如西北工业大学基于华为昇腾AI的面向飞行器的首个流体力学大模型——“秦岭· 翱翔”。
可以看到,高校研发的大模型越来越专业、细分。
从教育垂类大模型来看,浙江大学的智海-三乐和北京语言大学的桃李都算是教育的垂类大模型,他们既面向学生,又面向老师。相比而言,桃李专门针对汉语言学习,会更细分。
此外,很多高校大模型背后都有企业的身影,比如清华大学与字节跳动合作,浙江大学与阿里云合作,西北工业大学与华为合作等。可以说,当前产教融合进入到新阶段,前置到技术研发层面。
他山之石:国外高校重在为我所用?
跟国内高校聚焦大模型相比,国外高校似乎更看重为我所用,引导师生用好AI工具。
虽然有的学校也推出了大模型,但是更像是为某一门课程专门研发,如哈佛大学。
今年6月,哈佛大学CS50项目导师David Malan教授在邮件中提到,从秋季学期开始,CS50将使用自主研发的语言模型CS50 Bot作为助教。
CS50是哈佛大学入门级计算机科学课程,也是计算机系王牌课程,同时,CS50是edX上最受欢迎的课程之一,edX(在线教育公司2U旗下平台)是麻省理工学院(MIT)和哈佛大学(Harvard)合作打造的在线学习平台。
CS50 Bot是哈佛大学自研的一个大语言模型,它将负责在课堂上回答学生的课程问题,提供个性化的指导和代码debug,给学生的作业提出修改意见,7*24小时可以回答各种学生疑问。
通常,CS50 会有数百名校园学生和 40000 多名在线学生学习 ,现年 46 岁的 Malan 教授表示,即便上课过程中有 100 多名助教,也很难完全回答来自不同时区、知识和经验水平不同的学生所提出的问题。
而借助CS50 Bot,该课堂可以解决以上问题,且可以实现1对1学习服务。
不过,Malan教授向学生强调:“不管是接受人还是机器的信息,我们都要需要有批判思维。”
可以说,哈佛大学推出CS50 Bot,这算高校教育的一个里程碑。
在此之前,很多高校认为禁止学生使用AI工具,认为会对学生学习产生负面影响;而有的学校完全放开,认为可以帮助学生更好的学习和成长;还有一些学校允许学生有条件地使用,兼顾学生成长和教育原则。
哈佛大学的做法则受到广泛认可,从解放教师的角度出发,将人工智能工具为我所用;同时,引导学生正确使用AI工具。
紧跟着,就在8月22日,密歇根大学推出了面向全校师生和职工的一个生成式人工智能平台,秋季开学开始启用。据了解,该平台是由密歇根大学信息与技术服务部(ITS)开发的,部分功能将在9月30日后收费。
密歇根大学的校长小野三太表示:“这是全美第一家提供生成式AI平台的学校。”
据密歇根大学官网介绍,该大学将为全社区提供三种生成式AI服务,包括:U-M GPT、U-M Maizey和U-M GPT Toolkit。
U-M GPT,允许用户使用生成式AI工具,如ChatGPT等大模型工具,这项功能将是免费的。
U-M Maizey,它是一个聊天机器人和短信系统,允许用户访问人工智能语言模型来查询和质疑他们自己的数据集,U-M Maizey可以连接到谷歌和Canvas等平台。
U-M GPT Toolkit,为用户大规模构建、训练和托管AI模型提供了平台,它针对高级AI开发者提供了各种需求。
密歇根大学可以说是有条件地让学生使用AI工具的又一个典范。
可以说,今年秋季是一个新的节点,全球高校开启探索“AI模式”。