电话: 邮箱:
博 学 而 笃 志   切 问 而 近 思 SEEK BROAD KNOWLEDGE · ASK EARNESTLY

2026世界杯

2026世界杯

凯发娱乐(K8)官方网站 硅谷正在流行“氛围办公”:不敲键盘,对着电脑叽叽咕咕

发布日期:2026-05-26 18:46 来源:未知 作者:admin 浏览次数:

凯发娱乐(K8)官方网站 硅谷正在流行“氛围办公”:不敲键盘,对着电脑叽叽咕咕

这个春天运转,硅谷的办公室里,敲打键盘的哒哒声正在被嘀陈思咕的东谈主声取代。

有风险投资东谈主辱弄,当今去硅谷的 AI 创业公司拜访,嗅觉像走进了一个高端呼唤中心,只不外扫数东谈主都在跟 AI 聊天:职工们戴着电竞耳机坐在工位上,对着麦克风称王称霸。

这股风潮还有个名字,叫" voicepilled "——语音醒觉。LinkedIn 聚会首创东谈主 Reid Hoffman 在 2025 年秋天的一篇帖子里初次宣称我方被" voicepill "了。他写谈:"被  voicepill 的那一刻,等于你意志到一朝慎重用语音与时代交互,就能解锁一种全新的才智放大花式。"这个词借用了《黑客帝国》里红蓝药丸的隐喻,吞下这颗"语音药丸",你就会看到一个不同的出产力天下。

语音输入本人倒不是什么崭新事,苹果的 Siri 听写、Windows 语音识别、以至更早的 Dragon NaturallySpeaking 依然存在了好多年。但畴昔这些器具的体验极端折磨东谈主:识别率低,标点零乱,一句话说了三遍都不准,临了还不如我方打字。

实在的革新点是大鸿沟 AI 语音模子的训练。2022 年   OpenAI   发布了   Whisper,一个基于 Transformer 架构的开源语音识别模子,用 68 万小时的多语言音频数据考验而成。Whisper 的出现把语音转翰墨的准确率拉到了实用门槛之上。

而在此基础上,新一代听写器具举例 Wispr、Aqua Voice 等迈出了更要道的一步:它们不仅仅把你说的话逐字记载下来,还会用 LLM 对输出进行"润色",自动删除"嗯""啊"之类的填充词,修正语法,休养句式,以至左证你正在使用的诳骗场景来适配口吻和顺次。通盘进程蔓延时时在一到两秒之内。部分器具还支柱"敕令模式",用户不错用语音指示来裁剪已有文本,比如"把上一段改成变嫌式的口吻"或者"删掉临了一句"。

(开首:Wispr ai)

这种职责花式之是以让东谈主新生,有一个很直不雅的原因:东谈主言语的速率粗拙是打字速率的三倍。关于英文使用者来说,无为东谈主的打字速率在每分钟 40 到 80 个英文单词之间,而普通语速粗拙是每分钟 130 到 150 个单词(华文使用者的打字速率粗略在每分钟 80~100 字左右,而语速粗拙是 200~250 字之间)。

关于那些职责骨子主如果"把想法形成翰墨"的东谈主,比如写邮件、写文档、写代码提醒词,这意味着表面上不错把产出速率提高两到三倍。一些重度用户宣称我方的翰墨产出如实翻了几番。

更有道理的是,语音听写正在和另一个热点趋势合流:vibe coding(氛围编程)。这个由 Andrej Karpathy 在 2025 岁首提议的宗旨,指的是开发者不再逐行写代码,而是用天然语言刻画需求,太阳城娱乐游戏(SunGame)官网让 AI 编程器具(如 Claude Code、Codex)来生成代码。而当 vibe coding 遇上语音听写,开发者以至不需要坐在电脑前打字。他们不错一边散步一边口述需求,听写器具把语音转成翰墨 prompt,再由编程 AI 把 prompt 转成代码。Wispr 的首创东谈主 Tanay Kothari 说,他们的职工当今等于在办公室里走来走去,对着电脑言语,无谓再把念念考的进程绑定在桌前。

据媒体报谈,一些最狂热的用户以至购买了可编程脚踏板,一种原来属于游戏外设的东西,踩一下就能激活语音交互功能;还有东谈主在桌上架起鹅颈麦克风,等于体育解释员和牧师用的那种可周折发话器,离嘴更近言语更省力;Wispr 公司里面则流行把无线领夹麦别在衬衫上,职工们像是随时在录播客。这家公司以至打算之后向客户销售品牌麦克风。

图 | 可编程脚踏板 (开首:Amazon)

本钱市集昭彰对这种新的" vibe working "花式十分接待。诞生于 2021 年的 Wispr,首先的标的是作念脑机接口可衣裳开导,其后转型作念语音听写器具。据媒体报谈,2025 年 11 月 Wispr 的估值约 7 亿好意思元。而到了 2026 年 5 月,Wispr 的主见估值依然飙升至 20 亿好意思元。一个听写诳骗估值 20 亿,凯发娱乐(K8)官方网站足以发挥了市集对"语音取代键盘"这件事的看好进度。

于是,竞争也运滚动得强烈。同类公司 Aqua Voice 和 Willon 都拿到了 Y Combinator 的投资,初创公司 TalkTastic、Typeless、Superwhisper 各有拥趸。科技巨头也没闲着:在 2026 年 5 月的 Android Show 上,谷歌发布了   Rambler,一个内置于 Gboard 输入法、由 Gemini 驱动的听写功能,能把用户散乱的口述自动整理成运动文本。当平台级玩家入场,独处诳骗的生计空间会被怎样挤压,仍有待不雅察。

此外,这股新的时代趋势眼前,还存在一些实践的门槛。

首先是硬件层面的局限。现时主流的 AI 听写器具大多是 Mac 优先以至 Mac 独占的。Wispr Flow 和 Superwhisper 支柱 Mac,Aqua Voice 恒久以来仅限 Mac 平台(近期才运转支柱 Windows),TalkTastic 则是 iOS 和 Mac。而在企业环境中,Windows 仍然是十足主流操作系统。医疗、法律、政府、金融行业尤其如斯。

更辣手的是辛劳桌面环境:好多企业职工通过 Citrix、VMware Horizon 或 RDP(辛劳桌面合同)来走访职责系统,而大多量听写器具依赖剪贴板粘贴来输入翰墨,这在被组政策锁定的辛劳会话中根底行欠亨。

快乐彩正版app下载官网

其次是成本问题。以 Wispr 为例,它的订阅价钱是每月 18 好意思元。关于一个基础出产力器具来说,这个价钱让不少个东谈主用户踯躅。传统的 Dragon NaturallySpeaking 则需要数百好意思元的一次性买断用度。天然也有更低廉的聘用(比如一些器具提供 7 好意思元/月的决议,或者基于腹地模子的免费层级),但全体来看,语音听写还莫得形成一个东谈主东谈主猖厥破钞的默许选项。

还有一系列的杂音和阴私问题。

在海外,绽开式办公室本来就因为噪消息题饱受诟病。多项有计划标明,绽开式办公环境中不干系的语音杂音是影响职工注视力和面貌健康的浩瀚身分。而当今,语音听写正在往这个里注入更多杂音。想象一下:一个二十东谈主的开下班位区,有七八个东谈主同期在柔声嘟哝,有东谈主在口述邮件,有东谈主在对 AI 编程助手刻画一个 bug,有东谈主在用语音敕令修改文档顺次。即便每个东谈主都刻意压低音量,汇注在一都,也有余让东谈主头疼。

别称接收采访的使用者承认这"如实有点难过"。他说在家里用语音办公嗅觉像钢铁侠对 Jarvis 下指示,挺酷的;但在办公室里,当着共事的面自言自语,总归有些顽抗缓。何况当你在口述骨子时,周围的东谈主能听到你在说什么。无论是邮件骨子、代码逻辑,照旧交易想法,这些原来只存在于屏幕上的神秘信息,当今形成了公开的声波,总归不太平缓。而关于触及明锐信息的职责场景,还存在合规风险。

(开首:Youtube)

从更宏不雅的视角看,语音办公的兴起无意折射了一种时代趋势:东谈主机交互正在从"顺应机器的花式"向"顺应东谈主的花式"迁徙。键盘是一种为机器瞎想的输入界面,东谈主类花了一百多年去顺应它。而语音是东谈主类最原始、最天然的抒发花式。AI 的向上让机器终于能够交融东谈主类天然语态下的抒发,于是"让东谈主精采言语"就成了一个铿锵有劲的标的。

但东谈主类发明书写,本人等于因为语音抒发有其局限,它是线性的,信息密度低,也短少复杂结构的承载才智,何况易受环境影响。关于这些问题,语音听写器具可能还需要交出更好的谜底。

何况如果语音交互确凿成为主流职责花式,现存的办公室结构也将濒临重新瞎想。畴昔几十年里,办公空间默许劳动于沉着打字的东谈主类,而翌日,它也许要运转劳动一群握续柔声言语的东谈主。声学报复、半禁闭语音工位、针对不同杂音等第的空间分区,以至专诚用于东谈主机对话的"语音会议室"……这些听起来有些远方的瞎想,无意会成为标配。

参考联接:

1.https://www.theguardian.com/technology/2026/may/12/end-of-typing-workers-ditching-keyboards-voicepilling-ai-dictation

2.https://techcrunch.com/2026/05/10/get-ready-for-the-whisper-filled-office-of-the-future

3.https://www.wsj.com/tech/typing-is-being-replaced-by-whisperingand-its-way-more-annoying-a804fee7凯发娱乐(K8)官方网站