人工智能将改变我们的工作方式。至少最狂热的技术供应商是这么说的,现在包括微软在内。但在看到ChatGPT、Dall-E和其他人工智能系统集成到最新版本的Windows 11、Office和该公司的Microsoft 365平台后,我不能说我同意。
毫无疑问,微软正在努力推广其Copilot系统等新工具,将其集成到该公司和数亿用户的主要系统中。但作为一名超级用户-并接受给许多不了解情况的人提供的有限视角-我认为这些新工具除了偶尔的好奇心之外没有任何其他东西。
他们不会改变我的工作方式,我认为即使是那些从中受益最大的人也会犹豫是否尝试。
它起作用了,直到它不起作用
可以肯定的是,系统中有一些元素可能是有益的。基于ChatGPT的人工智能文本生成是戏剧性的,只需一两分钟就能填满一页信息,远远快于最疯狂的键盘骑手所能做到的速度。图像生成同样令人印象深刻,只需几行文字提示就能生成令人难以置信的细节和照片逼真的图像。如果你不是一个天生的作家,而且你不能在绘画中导航,这个东西看起来就像亚瑟·C·克拉克的经典技术,与魔术没有什么区别。
“人工智能”这个词让人联想到像《星际迷航》中的《指挥官数据》这样的科幻小说。但这是一个错误的措辞,坦率地说,我认为这是一个故意误导的词。即使是人工智能以目前的形式推出的最令人印象深刻的东西,也是基于预先存在的算法。令人难以置信的和近乎复杂的算法,但算法仍然。它们遵循着一个半个世纪以来从未改变过的计算法则:它们不能做任何他们没有被设计或指示去做的事情。
我将以注入人工智能的新油漆为例。在微软在纽约举行的Fall Surface发布会上,我被展示了一种自动区分前景和背景的油漆,毫不费力地模糊了一张狗从海滩上跑过的照片。令人印象深刻,对于那些不习惯Photoshop工具(或不想花钱)的人来说很有用。但这些都是移动应用程序多年来一直在做的事情,不需要远程数据中心的大量资源和始终在线的连接。
一些确实需要“大铁”力量的东西是图像生成。只需点击几下,一张巨大的华丽建筑的照片就会从天空中分离出来,新的分层工具允许示威者在它后面放入我要求的任何东西。我要了一场龙卷风,它提供了一张Dall-E生成的龙卷风图像,正好来自德克萨斯州的一个传奇故事。
但这是一个与建筑不同的图像,在一个单独的层上,根本不使用建筑作为参考。我可以把它放在大楼后面,用不匹配的光线和视角将两个完全不同的图像挤压在一起。新的人工智能油漆不能做的是,我怀疑微软希望你想象它可以做到的是,把龙卷风放在建筑的现有形象中,就像它是电影或专业营销工作室的效果一样。
人工智能图像生成工具正在达到的极限,是即使是中级用户通过在YouTube上进行半个小时的指导和图像搜索就可以学会的。这对你有什么好处?充其量,它为你节省了大约半小时。结果看起来像是,好吧,半个小时的油漆工作。作为一个每天使用平面设计工具的人,它并没有立即引发人们对人类过时的担忧。
在沙拉这个词中筛选
说到这一点:文本生成。ChatGPT吞噬和吐出大量文本信息的能力确实令人印象深刻。但当你想要用文本做更多细微差别的事情–人类需要大量时间和注意力去做的事情–它就会发生。一名示威者拿出一份5000字的书面文件,让副驾驶用Word进行总结。这使得总数降到了略高于2000字的…这仍然是你想要在一桌同事面前或在Zoom屏幕上阅读的更多内容。
当我让他把它删减到1000字以下时,整个系统都卡住了。信息实在太多了,要想在不丢失基本信息的情况下对其进行压缩。一个人可以做到这一点,即使你需要一个足够熟练的人来筛选沙拉这个词中大量可操作的即时信息。副驾驶则不能,他给出了几次近乎相同的、非要求的结果。
在微软Azure服务器思考了几分钟后,演示者指出,你仍然需要阅读产生的文字墙来检查它的准确性。或许更令人痛心的是,这个系统并没有完全创造出不存在的信息。
Outlook的演示正是做到了这一点,它自动生成了几百个单词的回复,插入了人工操作员从未想过的想法。如果他声称这些想法是他自己的,那么这些想法可能会给他带来麻烦,但后来他不记得了。我们已经看到,这种事情已经发生在渴望用人工智能驱动的传真机取代在线自我的人身上。
那么,如果系统的极限远远低于人工操作员的极限,而且它的输出仍然需要手工和眼睛检查,那么这实际上节省了多少工作?对于一位经理来说,这还不足以自信地裁员,我怀疑这是许多高管所希望的结果。这是在最好的情况下,系统在不从远程服务器返回错误的情况下工作。这种情况不止一次发生,而且在我看到的每一个演示中都至少发生了一次。
在非常特殊的情况下,副驾驶节省时间的能力是惊人的。例如,使用同样的5000字文档,演示者能够生成包含相关要点的20张幻灯片PowerPoint幻灯片。它甚至有相当吸引人的格式,没有版权的图片背景没有具体说明,但很好地拆分了黑白幻灯片。该系统可以插入自动生成的图像、必应搜索的免许可证图像或保存在本地文件夹中的图像。
那是节省时间的方法。在几分钟的时间里,系统生成了一份PowerPoint演示文稿,专家需要大约一个小时才能完成。但同样,结果将需要几乎相同的时间来手动检查…而且它的结果并不完全可靠或可重复。一个不能持续依赖的系统不能取代人类工人,即使是低级别的工人,尽管它有时可能会增加你的工作。
记住Windows8…的教训或者不是
这就引出了另一个问题:为什么微软要展示所有这些新技术,并如此迅速地将其推向其企业工具,而它显然缺乏这么多功能?我脑海中浮现的最接近的对比是Windows 8迅速转向触摸式界面,预计在iPad发布后,世界上会有很多人在使用触摸式平板电脑。
一个十年后似乎还没有到来的世界。我们又回到了旧的开始按钮和菜单,尽管它可能是逐渐演变的,但在Windows上的工作仍然主要由鼠标和键盘驱动。即使它令人印象深刻的触控支持,在很大程度上也是在复制现有的工具,如光标和滚轮。这场由手机引发的革命从未到来。
那么,在微软从那次经历中吸取教训,并将其大部分概念带回Windows 10之后,它为什么如此急于跳下另一个不确定的技术悬崖呢?我不能肯定地说。但如果我戴上我的科技分析师帽子–一顶又大又松、有点可笑的帽子,希望没有人会混淆我即将说的投资建议–我会把责任归咎于科技市场上吹来吹去的大量空话。
我怀疑,急于赶上人工智能趋势并希望其最梦幻的承诺成为现实的投资者,已经吸引了微软高管团队的注意。这些承诺包括取代很大一部分由柔软的、有资格的人类填补的工作,要求办公空间和Heh保险福利等不合理的费用。即使是少量的低级别员工被Azure云取代,也将代表着一大笔节省,如果微软能够正确地实现货币化,它将获得巨大的潜在利润。
微软、它的投资者,或者两者的某种组合,可能正在经历一种对错过的恐惧,动机是有问题的实用程序的人工智能工具或多或少地出现在每个竞争对手身上。也许它在企业级有更多的应用,在那里,已经存在了几十年的巨大的数字处理系统可能会从新一代算法处理中受益。但在用户层面,最大的变化–也是最大的恐惧–是人工智能取代了中低级人类工人。
我们已经看到了这方面的尝试。到目前为止,它们已经导致了如此可预见的问题,ChatGPT本身就可以告诉你它们正在到来。尽管这些工具正在变得令人印象深刻,尽管它们在未来会得到改进,但我并不认为它们能有效地取代大量的人类作家、分析师、艺术家等。
这并不是说人们不会尝试–尤其是那些掌管钱袋的人。这将归结为那些做出最终决定的人为了节省员工的钱而愿意容忍多大程度的质量下降。以及产生这些结果的成本有多高,即使它们不可避免地比使用柔软的人类便宜。Azure数据中心不是在树上生长的,运行它们所需的太瓦电力也不是。
全速前进,无论我们要去哪里
微软高管很清楚所有这些问题,比你我更细微的程度,但我认为有人告诉他们全速前进的人工智能,并谴责鱼雷的实际功能和结果。这种推动是来自顶层的,底层的一定程度的痛苦(对微软的产品团队和公司客户来说)都是可以容忍的。至少目前是这样。
我们至少在几年内不会看到后果。这会是Windows 8的一个时刻吗?在人们的记忆中,这主要是一个痛苦的教训,告诉你什么不该做?或者我会被证明是错的,人工智能是否会成为每个工人的数字工作者工具包…的重要组成部分在这么多人被替换后,还剩下什么工人?
时间会证明一切。我希望我能在身边帮助《时代》告诉我们这一点。
有话要说...