8176512
大模型演示造假?华为昇腾回应
文章
1
观察者网
05-16 23:00

大模型演示造假?华为昇腾回应

5月16日,针对网传华为大模型文生图现场疑似人工调取预置图片的消息,华为昇腾社区回应称,现场图片为实时生成,调用的是开源大模型,并非调取预置图片。

事件起源于5月10日的鲲鹏昇腾开发者大会,当时在一场面向开发者的技术讨论会上,华为演示了mxRAG SDK功能,展示如何通过十几行代码即可完成RAG应用开发。

网传视频及聊天截图显示,华为在演示文生图功能时,按下Crtl-C中断,显示对应代码为time.sleep(6)。有网友解读称,代码的意思是暂停6秒,然后调取预置图片展示出来。

此消息一出,立刻引发网友对技术能力真实性的讨论。有部分观点质疑,这是华为大模型能力演示造假,指责华为利用time.sleep(6)来模拟生成,实际是人工调取预置图片。

网传鲲鹏昇腾开发者大会现场图片

针对网络上的质疑,昇腾社区回应称,现场图片为实时生成,调用的是开源大模型。代码中有time.sleep(6)等表述,是命令等待读取外部开源大模型实时生成的图片,并非调取预置图片。本次展示的均为真实代码,也将在昇腾社区上开放,欢迎开发者使用并提出宝贵建议。

根据公开资料,mxRAG的功能为检索(Retrieval)、增强(Augmentation)和生成(Generation)。这一能力是目前开发大语言模型(LLM)所需的重要能力之一。

一些学术资料显示,LLM+RAG被应用于包问答系统、聊天机器人、事实验证、金融领域的决策支持等多个领域,未来还可以提高模型的可信度,开发多语言和多模态的RA-LLMs等。

尽管华为已公开回应,对于此次事件,网上多种观点仍在辩论。

华为昇腾社区官网截图

一些行业人士认为,time.sleep(6)可能是为了确保程序在演示过程中不会出现意外情况,而预设的一个缓冲步骤。这样的做法在技术演示中并不少见,目的是为了展示过程的平稳和可控。

也有专家指出,大模型的计算和生成过程确实需要时间,而time.sleep(6)可能是为了展示模型计算的实际耗时。在AI领域,模型的计算速度是衡量技术先进性的重要指标之一。

但同时也有开发者认为,文生图过程理论上“完全没必要sleep(6)”。

截至目前,华为此次展示的mxRAG SDK功能,还未在开发者资源下载中心上线。而由于昇腾社区暂未公布源代码,开发者目前也仅能通过网传代码截图进行经验判断和讨论。

编辑 张克 审读 伊诺 二审 关越 三审 万晖

未经许可或明确书面授权,任何人不得复制、转载、摘编、修改、链接读特客户端内容
报料
评论(0)

更多精彩内容请进入频道查看

打开读特,更多精彩