腾讯混元新技术给大模型 “去油”,让AI生成图像更真实!
近日,腾讯混元团队在官方公众号发布了最新研究成果 ——SRPO(语义相对偏好优化),旨在提升 AI 生成图像的真实感,尤其是解决开源文生图模型 Flux 在人物皮肤质感方面的 “过油” 问题。这项创新技术的推出,预计将为生图领域带来革命性的改变。 在数字艺术日益普及的今天,AI 生成图像的质量显得尤...
近日,腾讯混元团队在官方公众号发布了最新研究成果 ——SRPO(语义相对偏好优化),旨在提升 AI 生成图像的真实感,尤其是解决开源文生图模型 Flux 在人物皮肤质感方面的 “过油” 问题。这项创新技术的推出,预计将为生图领域带来革命性的改变。 在数字艺术日益普及的今天,AI 生成图像的质量显得尤...
GPT-5限时优惠!作为OpenAI迄今为止最先进的AI系统,GPT-5在推理、编码和多模态理解等方面表现出色,此次通过OpenRouter平台推出的限时折扣活动,将进一步降低用户接入门槛,助力全球开发者与企业探索其潜力。 活动详情曝光:一周内享50%折扣 据最新消息,OpenRouter平台从20...
近日,AI 推理技术的先行者 Groq 宣布成功融资7.5亿美元,融资后估值达到69亿美元。这轮融资由德克萨斯州的投资公司 Disruptive 领投,同时得到了黑石、纽伯格・伯曼、德意志电信资本合作伙伴以及一家大型美国西海岸共同基金经理的显著投资。此外,三星、思科、D1、Altimeter、178...
xAI创始人埃隆·马斯克(Elon Musk)刚刚宣布,备受期待的Grok5模型将在未来几周内开始训练。 ![6389371768409269614473843.png][1] 马斯克的声明是对近期AI基准测试进展的回应,尤其是基于当前Grok4模型的开源方案在ARC-AGI挑战赛中取得了突破性成果...
YouTube刚刚为全球3000万创作者投下了一枚重磅炸弹。在Made on YouTube活动上,平台宣布为YouTube Studio推出一系列新功能,从AI聊天机器人到面部相似性检测,这些工具将彻底改变创作者管理频道的方式。 最引人瞩目的功能当属面部相似性检测技术。这项功能最初在2024年发布...
据路透社报道,9月16日,华特迪士尼、康卡斯特旗下环球影业以及华纳兄弟探索公司联合向加州地方法院提起版权诉讼,矛头直指中国人工智能公司MiniMax。这三大好莱坞巨头指控MiniMax的图像和视频生成服务“海螺AI”(Hailuo AI),是利用未经授权的、从他们手中窃取的知识产权构建而成。 Dis...
OpenAI 已任命埃隆·马斯克旗下 xAI 的前财务主管 Mike Liberatore 为其新的商业财务主管。 根据公司的说法,Liberatore 将直接向首席财务官 Sarah Friar 汇报,并与联合创始人 Greg Brockman 的团队密切合作,负责管理和扩大 OpenAI 快速增...
最近,一家名为 CodeRabbit 的初创公司引起了广泛关注,它以 AI 为基础的代码审查平台在短短两年内迅速崛起。其创始人 Harjot Gill,曾在 2018 年将他的初创企业 Netsil 出售给 Nutanix,随后又创办了观察平台 FluxNinja。在 FluxNinja 期间,他观...
在周二举行的“Made on YouTube”直播活动中,YouTube 宣布为 Shorts 创作者推出一系列全新的生成式 AI 工具,旨在简化和加速短视频的创作流程。 此次更新的核心是集成定制版的谷歌文本转视频生成式 AI 模型 Veo3Fast。据 YouTube 介绍,这款模型能够以480p...
知名 AI 代码编辑器 Cursor 今日正式推出1.6版本更新,该版本引入多项创新功能,旨在提升开发者的生产力和团队协作效率。根据官方公告和社区反馈,这一更新特别强调自定义命令的实用性,已在内部团队中证明其对可重用提示的显著价值。 Cursor 作为一款基于 AI 的代码编辑工具,自推出以来以其智...
全球最受欢迎的AI演示工具 Gamma 今日宣布推出其划时代的版本 Gamma3.0,旨在彻底改变用户创建和编辑演示文稿的方式。此次更新的核心是两大创新功能:Gamma Agent 和 Gamma API。 Gamma Agent:AI驱动的演示文稿编辑 Gamma3.0引入的 Gamma Agen...
随着教育领域的不断发展,传统的教科书作为教学的重要工具,逐渐显露出一刀切的局限性。为了打破这种局限性,谷歌正在探索如何利用生成性 AI(GenAI)来自动生成多样化的教育材料。近期,谷歌推出了一项名为 “Learn Your Way” 的研究实验,旨在利用这一技术来创造更加有效和互动的学习体验。 该...
近日,Anthropic 宣布其 AI 助手 Claude 正式在 Apple 的旗舰集成开发环境 Xcode26中上线。此项新集成为开发者带来了强大的 AI 编程智能功能,帮助他们在构建、测试和发布 Apple 平台应用时更高效。 通过此项更新,开发者可以将 Claude 账号与 Xcode 连接...
![6389361634748140187725841.png][1] 腾讯集团高级执行副总裁、云与智慧产业事业群CEO 汤道生 9月16日,2025腾讯全球数字生态大会举行,腾讯集团高级执行副总裁、云与智慧产业事业群CEO汤道生表示,“向智能化要产业效率,向全球化要收入规模”,已经成为企业增长的两...
近日,腾讯推出了一种新方法,旨在提升 AI 生成图像的真实感与美学评分。据悉,这一微调技术在仅用32块 H20显卡训练10分钟后就能实现显著的收敛效果,其人工评估得分甚至提升了300% 以上。 当前的扩散模型虽然能够借助奖励机制来优化图像质量,但却面临着一些挑战。首先,模型优化步骤较少,容易出现所谓...
近日,媒体曝光了谷歌在英国埃塞克斯郡兴建新数据中心的规划文件,该项目预计每年将排放超过57万吨二氧化碳,相当于每周约500个短途航班的碳排放。该数据中心位于瑟洛克,面积达52公顷(约128英亩),计划包含多达四个数据中心,若获得批准,将成为一座 “超大规模” 的计算和人工智能中心。 ![202304...
9 月 16 日,在 2025 腾讯全球数字生态大会主峰会上,腾讯公布多项AI技术和产品最新进展,并宣布通过腾讯云全面开放腾讯AI落地能力及优势场景,助力“好用的AI”在千行百业中加速落地。 面对各界关注的算力问题,腾讯集团副总裁、腾讯云总裁邱跃鹏宣布,目前腾讯已经全面适配主流的国产芯片,并积极参与...
近日,字节跳动与香港大学联合推出了一款全新的开源视觉推理模型 ——Mini-o3,标志着多轮视觉推理技术的又一重大突破。与以往只能进行1-2轮对话的视觉语言模型(VLM)不同,Mini-o3在训练时限制了对话轮数为6轮,但在测试阶段却能将推理轮数扩展至数十轮,极大提升了视觉问题处理的能力。 Mini...
在最近于纽约举行的 AI 峰会上,谷歌的一位高管对公司在搜索结果中使用 AI 摘要的做法进行了辩护。这位名叫马克哈姆・埃里克森的副总裁在回应关于滚石母公司 Penske Media Corporation 提起的诉讼时表示,用户的需求正在从传统的 “10个蓝色链接” 逐渐转向由 AI 生成的上下文摘...
近日,知名编程辅助工具 Qoder 在经过一个月的公测后,正式对全球用户推出付费订阅计划。自2025年8月21日公测以来,Qoder 凭借其强大的上下文工程能力及多项受欢迎的功能,如 Repo Wiki 和 Quest Mode,赢得了全球开发者的广泛支持和喜爱。 此次订阅服务的推出,标志着 Qod...