巴比特 | 元宇宙每日必读:清华大学发布大模型综合性能评估报告,文心一言排名第二,仅次于GPT4,通义千问排在倒数第二
摘要:据“清元宇宙”报道,清华大学沈阳教授团队近日发布了《大语言模型综合性能评估报告》,报告从生成质量、使用与性能、安全与合规三个维度对文心一言、讯飞星火、通义千问、昆仑天工、GPT-4、ChatGPT 3.5 和 Claude 七个大语音模型进行了评估分析。据综合性能评估结果显示,GPT-4 排名第一,文心一言和 ChatGPT 3.5 分别排名第二三位,阿里云通义千问则排在第六位。
图片来源:由无界 AI 生成
热点资讯:
美团已正式入股 AI 公司光年之外
据界面新闻 8 月 7 日报道,天眼查 App 显示,8 月 3 日,北京光年之外科技有限公司发生工商变更,全资股东由王慧文变更为美团旗下天津三快科技有限公司。北京光年之外科技有限公司成立于 2018 年 7 月,法定代表人为王慧文,注册资本 100 万人民币,经营范围含技术服务、技术转让、技术开发、技术推广、技术咨询,销售自行开发的产品,计算机系统服务等。
6 月 29 日,美团发布公告称,以 20.65 亿元完成对大模型创业公司光年之外境内 100% 股权的收购。光年之外为王慧文创立的 AGI 创新企业,不久前,王慧文因身体原因,离岗就医及休养。此前报道,美团:将支持光年团队继续在大模型领域进行探索和研究。
联想浏览器推出小乐 AI 助手,实测已接入百度文心一言大模型
据 IT 之家 8 月 7 日消息,联想浏览器今日发布 9.0.2.7311 正式版本,小乐 AI 助手测试版加入到侧边栏。据反馈,这款 AI 助手接入了百度文心一言大模型。
经实测,如果询问小乐 AI 助手测试版“你是文心一言吗”,会得到肯定的答复,并且它会自我介绍称“我能够与人对话互动,回答问题,协助创作,高效便捷地帮助人们获取信息、知识和灵感”。据官方介绍,联想浏览器新版本具有三大特色功能:一是文案润色,总结提炼,邮件撰写;二是 AI 搜索功能,一次输入得到多种方案;三是 AI 对话强势结合搜索,让用户有问必有答复。
清华大学发布大模型综合性能评估报告:文心一言排名第二,通义千问排名第六
巴比特讯,据公众号“清元宇宙”,清华大学沈阳教授团队近日发布了《大语言模型综合性能评估报告》,报告从生成质量、使用与性能、安全与合规三个维度对大语言模型进行评估,并深入分析不同大语言模型之间的优劣。该报告总共对文心一言、讯飞星火、通义千问、昆仑天工、GPT-4、ChatGPT 3.5 和 Claude 七个大语音模型进行了评估分析。据综合性能评估结果显示,GPT-4 排名第一,文心一言和 ChatGPT 3.5 分别排名第二三位,阿里云通义千问则排在第六位。
此外,报告还针对大语言模型未来发展提出了强化跨语言迁移学习、扩大训练数据的范围、加强利用人工数据、推进敏感和有害信息的精准化过滤、理解社会影响和伦理限制等建议。
Aletheia:预估 AI 服务器市场规模 2025 年将达 1350 亿美元
据《科创板日报》8 月 7 日报道,研究机构 Aletheia 报告指出,预估 AI 服务器市场规模将在 2024 年翻倍、2025 年达到 1350 亿美元,是 2022 年规模的 4.5 倍。其中,GPU 在 AI 服务器中成本占比最高,Aletheia 认为,GPU 市场到 2025 年将较 2023 年成长 3 倍。英伟达为了满足 AI 服务器市场庞大的需求,将着手大幅增加 AI GPU 产能,预估英伟达 AI GPU 产能会在 2024 年增加 2.5 倍;公司数据中心业务营收在 2023-2026 年的年复合成长率将达 85%。
投融资:
AI 与 Web3 初创公司 Moonbox 完成 100 万美元融资
据 PRNewswire 报道,AI 与 Web3 初创公司 Moonbox 完成 100 万美元融资,OKX Ventures 领投。本轮融资将用于加速产品增长,并继续开发其核心技术,该技术的核心是构建由最新的生成式 AI 技术支持的应用程序,用于 Web3 和 NFT 应用程序。据悉,Moonbox 总部位于香港,已获得周星驰导演电影《西游・降魔篇》、《西游・伏妖篇》与《美人鱼》的 IP。该公司计划在 2023 年底前推出一系列受艺术和电影行业启发的 AI 驱动的 NFT 和应用程序。
Web3 奢侈品品牌 Juhnz 完成 100 万美元种子轮融资
巴比特讯,8 月 7 日,Web3 奢侈品品牌 Juhnz 完成 100 万美元种子轮融资,Bixin 领投,LK Ventures、新加坡与香港家族办公室,以及美国地产巨头等个人投资者参投。本轮融资将用于探索实体商品与区块链数字化应用结合,加快 Phygital 赛道的拓展。此外,Juhnz 首批将发布 500 份限量款中国顶级福建银针白茶 NFT,产品均配备高级动态加密的 NFC 芯片用于检测真伪及溯源,收到产品后,可用手机轻触芯片获取茶叶的所有信息集。
AI 驱动机器人初创公司“来飞智能”再获 Pre-A 轮融资,累计融资超千万美元
据《科创板日报》8 月 7 日报道,近日人工智能驱动机器人初创公司来飞智能宣布,已完成新一轮融资活动,累计融资已超过千万美元,为其在智能草坪护理机器人领域的场景性能持续领先提供了强大的资金支持。NOVABOT 机器人是来飞智能核心产品,是一款以人工智能和视觉感知技术为核心,以多传感器定位技术为支撑的智能割草机器人。
元宇宙荐读:
《沸腾 251 天,访谈近百位从业者,关于大模型世界的 5 个现状》
技术商业快速变化的半年来,业界关于大模型的认知与共识也不断更新,极客公园在与硅谷和中国近百位创业者、投资人、从业者交流后,总结出关于大模型创业的 5 个现状,尝试以此呈现一篇尚待验证的「大模型商业世界观」。谷歌的机遇错失与 OpenAI 的惊艳亮相实则提醒着我们——落后,先机,时有交替。当下的技术与商业演进远未到终局,真正的变革甚至还未正式开始。人们只需记住,创新可能随时、随地发生。
https://www.8btc.com/article/6828764
《突破不可能三角: AI创作工具,如何走出用户采纳的鸿沟?》
随着AIGC的火热,越来越多的AI创作工具展现在我们面前,越来越多创作者也在尝试新工具和新方法。但实际上真正的问题才刚刚开始,在昂贵的流量和算力成本之下。用户面对着大量雷同的AI工具的时候,新用户如果无法留存那就是意味着成本的损失。如何让新用户真正的采纳我们的产品也显得尤为重要。
https://www.8btc.com/article/6828746