AI 学霸遭遇重创!GPT-4o 专家考试仅得 2.7 分
最近一项名为 “人类终极考试”(HLE)的测试结果让我们重新审视 AI 的真实能力。根据《自然》杂志的报道,GPT-4o 在这 2500 道由全球专家出题的测试中,仅获得了可怜的 2.7 分(满分 100 分),而表现最好的 AI 模型也仅得 8 分。这一结果让人质疑,AI 的强大究竟是实打实的实力...
最近一项名为 “人类终极考试”(HLE)的测试结果让我们重新审视 AI 的真实能力。根据《自然》杂志的报道,GPT-4o 在这 2500 道由全球专家出题的测试中,仅获得了可怜的 2.7 分(满分 100 分),而表现最好的 AI 模型也仅得 8 分。这一结果让人质疑,AI 的强大究竟是实打实的实力...
尽管当前的AI大模型在逻辑推理和任务处理上表现惊人,但一个长期被忽视的技术缺陷可能正成为通往通用人工智能(AGI)道路上的巨大障碍。近日,曾参与 OpenAI 推理模型 o1和 o3开发的核心研究员 Jerry Tworek 在受访时直言:目前的AI模型根本无法从错误中汲取教训。Tworek 指出,...
随着人工智能生成内容(AIGC)的泛滥,针对影视经典及英雄模范人物的恶意篡改行为正面临严厉监管。记者从国家广播电视总局获悉,自2026年1月1日起,全国范围内开展了为期一个月的“AI 魔改”视频专项治理行动。核心整治:守护经典与英模形象本次专项行动将重点指向了对社会主流价值及文化遗产的保护。治理范围...
随着这些技术的普及,AI 相关的 API 流量激增,催生了 “智能交通枢纽”—— 大模型网关。这个新兴的技术解决方案旨在高效管理 AI 流量,确保企业能够顺利使用各种 AI 模型。在现实业务中,企业面临着如何有效接入和管理多种 AI 模型的挑战。这些模型可能来自于不同的提供商,API 接口和数据格式...
OpenAI 在其官方平台宣布,为 Plus、Pro 和 Business 用户推出了全新的 “Thinking 调整功能”,这项新功能允许用户自主选择 GPT-5模型的思考时长,从而更好地平衡回复的速度与智能程度。 这项更新目前已经在 ChatGPT 网页端上线。用户可以在设置中选择不同的模式来适...
微软公司日前宣布,将支付62亿美元租赁挪威的人工智能计算能力。这一重大投资是与英国数据中心公司 Nscale Global Holdings Ltd. 及挪威投资公司 Aker ASA 的合作成果。根据双方的声明,此项目将依托于 “保障的电网容量和完全可再生的电力” 来进行运作。这意味着,微软的 A...
随着 AI 技术的不断进步,如何让大模型具备 “并行思维” 能力,成为了研究者们关注的热点话题。最近,腾讯 AI Lab 联合多所高校的研究团队推出了一个名为 Parallel-R1的全新强化学习(RL)框架,旨在教会大模型如何同时探索多条推理路径。这一创新的框架为应对复杂的数学推理任务开辟了新思路...
近日,人工智能领域知名企业深度求索( DeepSeek)发布了一则公告,提醒用户注意防范不法分子的诈骗行为。公告中指出,近期有不法分子冒充 “深度求索” 官方或员工身份,伪造工牌和营业执照等材料,在多个网络平台以 “算力租赁” 或 “股权融资” 等名义进行诈骗,严重侵犯了用户的权益,并损害了公司的声...
近日,腾讯混元团队在官方公众号发布了最新研究成果 ——SRPO(语义相对偏好优化),旨在提升 AI 生成图像的真实感,尤其是解决开源文生图模型 Flux 在人物皮肤质感方面的 “过油” 问题。这项创新技术的推出,预计将为生图领域带来革命性的改变。 在数字艺术日益普及的今天,AI 生成图像的质量显得尤...
GPT-5限时优惠!作为OpenAI迄今为止最先进的AI系统,GPT-5在推理、编码和多模态理解等方面表现出色,此次通过OpenRouter平台推出的限时折扣活动,将进一步降低用户接入门槛,助力全球开发者与企业探索其潜力。 活动详情曝光:一周内享50%折扣 据最新消息,OpenRouter平台从20...
近日,AI 推理技术的先行者 Groq 宣布成功融资7.5亿美元,融资后估值达到69亿美元。这轮融资由德克萨斯州的投资公司 Disruptive 领投,同时得到了黑石、纽伯格・伯曼、德意志电信资本合作伙伴以及一家大型美国西海岸共同基金经理的显著投资。此外,三星、思科、D1、Altimeter、178...
xAI创始人埃隆·马斯克(Elon Musk)刚刚宣布,备受期待的Grok5模型将在未来几周内开始训练。 ![6389371768409269614473843.png][1] 马斯克的声明是对近期AI基准测试进展的回应,尤其是基于当前Grok4模型的开源方案在ARC-AGI挑战赛中取得了突破性成果...
YouTube刚刚为全球3000万创作者投下了一枚重磅炸弹。在Made on YouTube活动上,平台宣布为YouTube Studio推出一系列新功能,从AI聊天机器人到面部相似性检测,这些工具将彻底改变创作者管理频道的方式。 最引人瞩目的功能当属面部相似性检测技术。这项功能最初在2024年发布...
据路透社报道,9月16日,华特迪士尼、康卡斯特旗下环球影业以及华纳兄弟探索公司联合向加州地方法院提起版权诉讼,矛头直指中国人工智能公司MiniMax。这三大好莱坞巨头指控MiniMax的图像和视频生成服务“海螺AI”(Hailuo AI),是利用未经授权的、从他们手中窃取的知识产权构建而成。 Dis...
OpenAI 已任命埃隆·马斯克旗下 xAI 的前财务主管 Mike Liberatore 为其新的商业财务主管。 根据公司的说法,Liberatore 将直接向首席财务官 Sarah Friar 汇报,并与联合创始人 Greg Brockman 的团队密切合作,负责管理和扩大 OpenAI 快速增...
最近,一家名为 CodeRabbit 的初创公司引起了广泛关注,它以 AI 为基础的代码审查平台在短短两年内迅速崛起。其创始人 Harjot Gill,曾在 2018 年将他的初创企业 Netsil 出售给 Nutanix,随后又创办了观察平台 FluxNinja。在 FluxNinja 期间,他观...
在周二举行的“Made on YouTube”直播活动中,YouTube 宣布为 Shorts 创作者推出一系列全新的生成式 AI 工具,旨在简化和加速短视频的创作流程。 此次更新的核心是集成定制版的谷歌文本转视频生成式 AI 模型 Veo3Fast。据 YouTube 介绍,这款模型能够以480p...
知名 AI 代码编辑器 Cursor 今日正式推出1.6版本更新,该版本引入多项创新功能,旨在提升开发者的生产力和团队协作效率。根据官方公告和社区反馈,这一更新特别强调自定义命令的实用性,已在内部团队中证明其对可重用提示的显著价值。 Cursor 作为一款基于 AI 的代码编辑工具,自推出以来以其智...
全球最受欢迎的AI演示工具 Gamma 今日宣布推出其划时代的版本 Gamma3.0,旨在彻底改变用户创建和编辑演示文稿的方式。此次更新的核心是两大创新功能:Gamma Agent 和 Gamma API。 Gamma Agent:AI驱动的演示文稿编辑 Gamma3.0引入的 Gamma Agen...
随着教育领域的不断发展,传统的教科书作为教学的重要工具,逐渐显露出一刀切的局限性。为了打破这种局限性,谷歌正在探索如何利用生成性 AI(GenAI)来自动生成多样化的教育材料。近期,谷歌推出了一项名为 “Learn Your Way” 的研究实验,旨在利用这一技术来创造更加有效和互动的学习体验。 该...