|
 【产通社,12月29日讯】2025年,AI在软件领域继续占据重要地位,但人们却以前所未有的激情与软件的惊人能力和惊人缺点作斗争。新的研究发现,AI智能体完成的任务每7个月翻了一番,这是一个惊人的指数增长率。但他们的工作质量仍然很差,在最艰巨任务上的成功率约为50%。聊天机器人正在协助程序员,甚至自主编码,但这可能无助于解决最大、最昂贵的IT故障,这些故障源于过去20年或更长时间里一直存在的管理故障。 AI的能源需求仍然是一个主要问题。为了缓解这种情况,一家初创公司正在努力通过使计算可逆来减少计算中产生的热量。另一项研究是构建一台真实的人脑细胞计算机,能够对候选药物进行测试。还有一些人甚至考虑将数据中心搬上月球。 1.AI洪流中的Python语言 虽然今年软件语言的排名相当可预测——Python仍然是第一,但软件工程的未来是不确定的。随着AI聊天机器人协助许多人完成编码任务,或者自行编码,收集软件工程师日常工作的可靠数据变得越来越不同。人们不再在StackExchange或类似网站上发布问题,而是直接问聊天机器人。 今年的顶级编程语言列表尽最大努力处理这些有限的数据,但它也提出了一个问题:在AI为我们编写大部分代码的世界里,编程语言将如何改变?我们还需要它们吗,还是AI会简单地生成优化的汇编代码,而不需要抽象? 2.IT经理如何应对软件项目失败 Robert Charette是一位终身技术专家,也是IEEE Spectrum的常客,他在2005年写过关于软件项目以灾难告终的所有已知、可预防的原因。20年后,除了因软件故障而损失的数万亿美元外,一切都没有改变。 在这篇3500多字的长篇大论中,Charette讲述了多个案例研究,并辅以统计数据,讲述了当今IT管理微不足道的状态。最重要的是,他解释了为什么AI不会来救援这些软件项目。 3.片上人脑细胞开始出售 澳大利亚初创公司Cortical Labs宣布,他们正在销售一款由硅芯片上的80万个活体人类神经元驱动的生物计算机。只需35000美元,你就可以得到一个盒子里的迷你大脑,它可以实时学习、适应和响应刺激。该公司已经通过教实验室培养的脑细胞玩Pong来证明了这一概念(它们在学习效率上经常击败标准的AI算法),但真正的应用是药物发现。正如一位科学家所说,这个“缸里的小大脑”让研究人员测试实验药物是否能恢复受损神经培养物的功能。 4.大型语言模型正呈指数级增长 在评估大型语言模型(LLM)性能的方法上,目前很难达成一致。非营利研究组织模型评估与威胁研究(METR)提出了一个直观的指标——跟踪人类完成AI可以完成的任务需要多长时间。根据这个指标,LLM能力每七个月翻一番。如果这一趋势继续下去,到2030年,最先进的模型可以快速处理目前需要人类整整一个月工作的任务。 但是,就目前而言,AI并不总是做得很好——对于最长、最具挑战性的任务,正确完成工作的机会约为50%。所以问题是:一个快速、廉价、一半时间都在生产垃圾的员工究竟还有多少价值? 5.可逆计算脱离实验室 有一个令人惊讶的原理将所有软件与硬件的底层物理联系起来:擦除计算机中的一点信息必然会消耗能量,通常会以热量的形式损失。避免失去这种能量的唯一方法是永远不要擦除信息。这是可逆计算(reversible computing)背后的基本思想,这种方法直到今年才在学术领域得到应用。 经过30年的学术研究,可逆计算终于与初创公司Vaire computing一起商业化。Vaire的第一个原型芯片在算术电路中回收能量。该团队声称,通过他们的方法,他们最终可以将能效提高到传统芯片的4000倍。 关键在于,这需要新的栅极架构、新的设计工具,以及在芯片上集成MEMS谐振器。但是,随着原型的开发,可逆计算已经从“有趣的理论”发展为“我们实际上正在构建这个” 6.垂死的Airbnb软件重获新生 Apache Airflow——最初由Airbnb构建的开源工作流编排软件——到2019年基本上已经死亡。然后,一位热心的开源贡献者在物联网工作时偶然发现了它,并认为“这太好了,不能死。”他召集了社区,到2020年底推出了Airflow 2.0。 现在,这个项目正在蓬勃发展,每月有3500万到4000万次下载,全球有3000多名贡献者。Airflow 3.0采用模块化架构,可以在任何地方运行。 7.医生会看到你的电子健康记录 2004年,布什总统为美国设定了到2014年过渡到电子健康记录(HER)的目标,承诺改变医疗保健并节省大量成本。20年来共投入超过1000亿美元,目前已实现了EHR的广泛采用,也创造了一个不同的噩梦。医生现在平均每天花4.5个小时盯着屏幕,而不是看着病人,点击设计糟糕的软件系统。 在EHR准备就绪之前急于采用EHR,意味着忽视了关于系统工程、互操作性和网络安全的警告。现在,我们陷入了各自为政的系统中(平均每家医院内部使用10家不同的EHR供应商),医生也经历了创纪录的倦怠水平。最重要的是,自2009年以来,数据泄露已经暴露了5.2亿条记录。 目前,医疗保健成本并没有像承诺的那样下降,已经达到4.8万亿美元,占美国国内生产总值的17.6%。更讽刺的,AI抄写员现在正在开发中,以解决上一代技术造成的问题,使医生能够再次看到患者,而不是他们的键盘。 8.在月球上建立数据中心? 基于太空或月球的数据中心是一条有前景的道路,还是一个狂热的梦想,是目前很多争论的热点主题。然而,今年早些时候,Lonestar Data Holdings公司利用Intuitive Machines着陆器向月球发射了一个1公斤、8TB的小型数据中心。目标是保护敏感数据免受地球灾难(海底电缆切断、飓风、战争)的影响,并利用数据主权法律中的漏洞——因为月球不受任何国家的管辖,你可以根据任何国家的法律托管黑匣子。 月球表面有-173°C的永久阴影陨石坑,这可能会使冷却更容易(尽管缺乏大气层使热辐射变得具有挑战性)。附近阳光明媚的山峰将提供太阳能,目前已经一些地方政府对此很感兴趣——佛罗里达州和马恩岛已经在那里存储数据。 但问题是显而易见的:1.4秒的延迟限制了实时应用和推广。同时,修复任何东西都需要往返月球,这也让带宽变得很糟糕。(编译:镨元素;剪报来源:IEEE)
|