OpenAI语音转录器具被曝严重幻觉:转录100小时,一半儿在瞎说

发布日期:2024-10-30 05:48    点击次数:91

西风 发自 凹非寺

量子位 | 公众号 QbitAI

OpenAI的AI语音转写器具,阿谁堪称近乎“东谈主类水平”的Whisper,被曝幻觉严重——

100多小时转录,被工程师发现约一半皆在瞎说。

更严重的是,好意思联社还爆料有医疗机构应用Whisper来转录医师与患者的诊断,顿然激勉大皆网友眷注。

据悉,明尼苏达州的曼卡托诊所和洛杉矶儿童病院在内的特出30000名临床医师和40个卫生系统已初始使用法国AI调整公司Nabla基于Whisper打造的器具。

何况他们仍是转录了省略700万次医疗就诊。

网友纷繁暗示这就有点吓东谈主了。

值得一提的是,OpenAI之前早就教养过,该器具不应在“高风险限制”中使用。

针对最新爆料,有OpenAI发言东谈主回复,OpenAI会在模子更新中加入相应的反馈机制。

OpenAI被督促飞快科罚此问题

Whisper是OpenAI老早前推出的开源自动语音识别(ASR)系统,于2022年9月发布。

它选拔简便的端到端神志,基于编码器-解码器Transformer架构。输入音频将被分红30秒的块,滚动为梅尔倒谱(音频特征索要神志之一,log-Mel spectrogram),然后传入编码器。

流程68万小时的多话语和多任务监督采集数据的检会,Whisper不错进行多话语转录。

Whisper推出后获得平淡应用,如今GitHub已揽获70.2k标星:

据悉,它还被集成在ChatGPT的一些版块中,同期亦然Oracle和微软云估计平台的一项内置做事,而这些平台为专门户千家公司提供做事。

此外,仅在上个月,HuggingFace上的一个最新版块Whisper就被下载了超420万次。HuggingFace社区的机器学习工程师Sanchit Gandhi暗示,Whisper是最受接待的开源语音识别模子。

而目下,据好意思联社报谈,许多盘问东谈主员和工程师反应,在职责中他们泛泛际遇Whisper产生的幻觉。

举例,密歇根大学的一位盘问员在尝试改换模子之前,发现其检讨的每10份音频转录中有8份出现了幻觉。

一位机器学习工程师指出,在他分析的特出100小时Whisper转录中,约莫一半出现了幻觉。

还有一位诞生者暗示,在他使用Whisper创建的26,000份转录中,真的每一份皆发现了幻觉。

……

这种问题致使存在于录制精湛的短音频样本中。

在最近的一项盘问中,估计机科学家们在审查的特出13000个了了音频片断中发现了187个幻觉。

工程师和盘问东谈主员暗示,他们从未见过其它任何AI驱动的转录器具像Whisper这么频繁地产生幻觉。

Whisper幻觉严重的原因目下尚未可知,但有软件诞生者暗示,这些臆造本色雷同发生在停顿、有布景声息或音乐播放时。

之前,OpenAI就有教唆:

不要在方案情境中使用Whisper,准确性上的劣势可能导致效果出现理会偏差。

然鹅,好意思联社暗示,这一教养并未收敛一些病院或医疗中心使用Whisper等语音转翰墨模子——

包括明尼苏达州的曼卡托诊所和洛杉矶儿童病院在内,仍是有超30000名临床医师和40个医疗系统仍是初始使用由Nabla公司基于Whisper诞生的器具。

Nabla CTO Martin Raison称,该器具针对医疗话语对模子进行了微调,用于转录和转头患者的调换。

目下,该器具已被用于转录约700万次医疗就诊。

在得知Whisper可能会产生幻觉后,Nabla暗示正在科罚此问题,不外:

由于“数据安全原因”,Nabla的器具会删除原始音频,无法将Nabla生成的AI文本与原始灌音进行相比。

此外,据了解,Whisper还被用来为聋东谈主和听力勤奋者创建字幕。

Whisper幻觉严重问题被发现后,有东谈主敦促OpenAI飞快科罚此问题。

本年2月离开OpenAI的盘问员William Saunders也开麦了:

若是公司欢快优先磋议,这似乎是不错科罚的。若是你把它放出去,东谈主们过于自信于它的功能,并将其集成到统共这些其他系统中,那就成了问题。

有OpenAI发言东谈主回复称,公司执续盘问怎样减少幻觉气候,并感谢盘问东谈主员的发现,同期补充谈OpenAI会在模子更新中融入相应反馈机制。

参考一语气:[1]https://apnews.com/article/ai-artificial-intelligence-health-business-90020cdf5fa16c79ca2e5b6c4c9bbb14[2]https://x.com/AP/status/1850150400424345858

— 完 —

量子位 QbitAI · 头条号签约

眷注咱们,第一时刻获知前沿科技动态