超越美学:医疗AI优先考虑可靠性和准确性以建立临床信任

【编者按】

当AI从追求图像美观转向诊断精准,医疗影像技术正迎来关键转折。本期聚焦人工智能在医学影像领域的深度变革:从生成式AI破解罕见病数据困局,到自监督学习降低标注依赖,技术演进始终围绕临床价值展开。这不仅关乎算法优化,更是对生命责任的重新校准——在风险与信任并存的医疗场景中,让AI真正成为医生可靠的“数字战友”,共同守护患者健康。

Photo for article
技术细节:追求精准

在医疗保健人工智能的关键转变中,研究人员和开发者越来越关注处理医学影像的AI方法的可靠性和诊断准确性,果断超越单纯的美学质量。这种重新优先级的调整凸显了对AI在临床环境中关键作用的成熟理解,在这种环境中,风险天然很高,对技术的信任至关重要。这一关注点的直接意义是推动AI解决方案提供真正可信且具有临床意义的见解,能够增强人类专业知识并改善患者预后。

医学影像AI的演进以几项复杂的技术进步为标志,旨在增强诊断效用、可解释性和鲁棒性。生成式AI(GAI)利用生成对抗网络(GANs)和扩散模型等模型,现在不仅用于图像增强,更重要的是用于数据增强,创建合成医学图像以解决罕见疾病的数据稀缺问题。这使得训练更鲁棒的AI模型成为可能,甚至支持多模态转换,例如将MRI数据转换为CT格式以进行更安全的放射治疗规划。这些方法与先前可能优先考虑视觉愉悦结果的方法显著不同,因为新的焦点是从低质量图像中提取细微的病理信号,以改善诊断和患者安全。

自监督学习(SSL)和对比学习(CL)也日益受到关注,减少了对成本高昂且耗时的手动标注数据集的严重依赖。SSL模型在大量未标注的医学图像上进行预训练,学习强大的特征表示,显著提高了肺结节和乳腺癌检测等任务的分类器准确性和鲁棒性。这种方法促进了跨不同成像模式的更好泛化,暗示了医学影像”基础模型”的出现。此外,联邦学习(FL)提供了一种保护隐私的解决方案,以克服数据孤岛问题,允许多个机构协作训练AI模型而无需直接共享敏感患者数据,解决了一个重大的伦理和实践障碍。

“可解释AI(XAI)和不确定性量化(UQ)的整合正变得不可或缺。XAI技术(例如显著性图、Grad-CAM)提供了AI模型如何做出决策的见解,摆脱了不透明的’黑盒’模型并建立了临床医生的信任。”

UQ方法量化了AI对其预测的信心,对于识别模型可能不太可靠的情况至关重要,从而提示人类专家审查。AI研究界和行业专家对AI革新诊断潜力的初步反应普遍热情,研究表明AI辅助的放射科医生可以更准确并减少诊断错误。然而,存在谨慎的乐观态度,强烈强调严格验证、解决数据偏见以及AI需要作为人类专家的助手而非替代品。

企业影响:新的竞争优势

对可靠性、准确性、可解释性和隐私的强化关注正在从根本上重塑医学影像领域AI公司、科技巨头和初创企业的竞争格局。主要参与者如微软(NASDAQ: MSFT)、英伟达公司(NASDAQ: NVDA)和谷歌(NASDAQ: GOOGL)正在大力投资研发,利用其云基础设施和AI能力开发鲁棒的医学影像套件。西门子医疗(ETR: SHL)、GE医疗(NASDAQ: GEHC)和飞利浦(AMS: PHIA)等公司正将AI直接嵌入其影像硬件和软件中,增强扫描仪能力并简化工作流程。

像Aidoc、Enlitic、Lunit和Qure.ai这样的专业AI公司和初创企业,通过为特定诊断挑战提供专注、高准确性的解决方案,正在占据重要的市场地位,通常在紧急病例优先排序或特定疾病检测等领域表现出卓越性能。不断演变的监管环境,特别是即将出台的欧盟AI法案将医疗AI归类为”高风险”,意味着能够明确证明可信度的公司将获得显著的竞争优势。这种严格性虽然可能减缓市场进入,但对于患者和专业信任至关重要,并作为一个强大的差异化因素。

“市场正在将其价值主张从简单的’更快’或’更高效’的AI转变为’更可靠’、’更准确’和’道德健全’的AI。能够提供改善患者预后和健康经济效益的现实世界证据的公司将受到青睐。”

这也意味着对传统工作流程的颠覆,因为AI自动化了常规任务,减少了报告周转时间,并增强了诊断能力。放射科医生的角色正在演变,将他们的焦点转向更高层次的认知任务和患者互动,而不是被取代。采用”人在回路”方法的公司,即AI增强人类能力,在临床环境中更有可能取得成功和被采纳。

更广泛的意义:医疗保健的范式转变
查看全文: 点击查看原文 |
⏰ 发布时间: 2025年11月17日

玩美移动AI和AR订阅服务推动收入增长

【编者按】

在当前宏观经济不确定性加剧的背景下,企业对AI技术的应用正面临现实考验。玩美移动的案例揭示了虚拟试穿技术发展的矛盾现状:一方面,消费者对AI购物助手的信任度仍待提升;另一方面,该技术已被证实能显著提升销售转化率。这种技术价值与市场接受度之间的落差,正是数字化转型过程中必须跨越的鸿沟。如何在技术创新与市场教育之间找到平衡点,将成为推动AI在零售领域落地的关键。

Perfect Corp adds contactless virtual makeup try on features.
“在更广泛的宏观经济不确定性背景下,我们的客户对AI持谨慎态度,”玩美移动创始人、董事长兼首席执行官张华祯在一份声明中表示。

该公司对其企业对企业业务保持”审慎的近期展望”。

深度洞察

玩美移动为护肤、彩妆、服装等多个领域提供虚拟试穿技术,已有超过800个时尚和美妆品牌使用其数字体验服务。

从移动应用到技术部署,玩美移动已在各种虚拟试穿应用场景中确立了自己的地位。该公司通过收购Farfetch旗下的Wannaby以及扩展其医疗水疗合作伙伴,进一步巩固了在虚拟试穿领域的地位。

对AI的犹豫是该技术在现代购物旅程中普及的一个障碍。根据YouGov的调查,超过五分之二的美国人表示他们不信任AI购物助手。然而,最近的一项玩美移动调查发现,实施虚拟试穿技术可以帮助销售转化率提高2.5倍。

查看全文: 点击查看原文 |
⏰ 发布时间: 2025年07月31日

【加拿大】为何突然人人都变成了玩偶?最新AI趋势不仅仅是无害的娱乐

【编者按】

当AI滤镜将普通人一键变成塑料质感的玩偶形象,这场席卷全球社交媒体的狂欢已超越单纯的技术娱乐。从明星政要到商业品牌,从轻松搞笑的TikTok到严肃的职场平台,这场”玩偶化”浪潮折射出数字时代身份表达的新形态。在虚拟形象与真实身份边界日益模糊的当下,我们既见证着技术赋权带来的创意迸发,也需思考这种集体性形象重塑背后的文化隐喻与社会认同。

The AI-generated dolls in fake packaging. One says marketer, one says Dawn Butler MP, and one says Suzie vacay edition.
AI玩偶趋势席卷社交媒体

如果你最近经常刷社交媒体,你可能会注意到很多…玩偶。
X平台和Facebook信息流中到处都是玩偶。Instagram?玩偶。TikTok?你猜对了:玩偶,还有制作玩偶的教程。甚至连LinkedIn这个可能是最严肃、最不有趣的社交平台也到处都是玩偶。
你可以称之为芭比AI处理或芭比盒子趋势。或者如果芭比不是你的菜,你可以选择AI动作人偶、动作人偶入门包或ChatGPT动作人偶趋势。但无论你怎么标记它,玩偶似乎无处不在。

名人、政要和品牌纷纷加入

在这一新趋势中,人们使用ChatGPT等生成式AI工具将自己重新想象成玩偶或动作人偶,并配有各种配件。事实证明这相当受欢迎,不仅仅是影响者在参与。

None

名人、政治家和主要品牌都纷纷加入。报道这一趋势的记者们也制作了自己拿着麦克风和相机的版本。用户们几乎为所有你能想到的知名人物制作了版本,从亿万富翁埃隆·马斯克到女演员兼歌手爱莉安娜·格兰德。

起源于LinkedIn的营销趋势
专家警告:不仅仅是无害的娱乐

虽然它们有一些相似之处(模仿美泰芭比的盒子和包装、个性驱动的配件、塑料般的微笑),但它们都像发布它们的人一样各不相同,除了一个关键共同特征:它们不是真实的。
但此后它已经泄露到其他平台,似乎每个人都在找点乐子,看看塑料生活是否真的如此美妙。然而,几位接受CBC新闻采访的AI专家表示,这不一定就是无害的娱乐。

“在生成式AI方面,现在仍然非常像狂野西部,”多伦多城市大学社交媒体实验室研究主任Anatoliy Gruzd教授说。”大多数政策和法律框架还没有完全跟上创新的步伐,这取决于AI公司来决定他们将如何使用你提供的个人数据。”
This photo illustration taken on April 2, 2025 shows a woman looking at a Facebook user profile displaying an image generated by artificial-intelligence (AI) in the style of Studio Ghibli animation on a mobile phone in Bangkok.
隐私担忧

阿尔伯塔大学计算机科学助理教授Matthew Guzdial表示,从社会学角度来看,生成玩偶趋势的流行一点也不令人惊讶。

“这是我们拥有社交媒体以来就有的那种互联网趋势。也许过去是转发电子邮件或分享结果的测验,”他告诉CBC新闻。

但与任何AI趋势一样,人们对其数据使用存在一些担忧。
生成式AI总体上带来了重大的数据隐私挑战。正如斯坦福大学以人为本人工智能研究所所指出的,数据隐私问题和互联网并不新鲜,但AI如此”渴望数据”,以至于加剧了风险的规模。

“如果你向在线系统提供关于你的非常个人化的数据,比如你的脸、你的工作或你最喜欢的颜色,你应该明白这些数据不仅仅对获得即时结果有用——比如一个玩偶,”研究AI和人权的英属哥伦比亚大学政治学教授Wendy Wong说。
None
查看全文: 点击查看原文 |
⏰ 发布时间: 2025年04月15日

NVIDIA RTX神经渲染开启AI驱动图形创新的新时代 | NVIDIA技术博客

【编者按】

RTX神经材质与次表面散射两大技术突破,正重新定义游戏画面的真实感边界。前者通过AI压缩实现电影级材质的实时渲染,后者精准模拟光线在皮肤中的散射效应,让虚拟角色告别”塑料感”。随着相关SDK即将开放,这些曾属于影视级的技术正加速融入游戏开发流程,预示着一个更具沉浸感的数字视觉新时代。

Graphic titled ‘NVIDIA ACE Enables Autonomous Game Characters’ with five columns labeled (left to right) User Interaction, Perception, Cognition, Action, and Rendering.
RTX神经材质技术

利用AI压缩通常为离线材质保留的复杂着色器代码,这些材质采用多层结构如瓷器和丝绸。材质处理速度提升高达5倍,使得以游戏就绪帧率渲染电影级质量资产成为可能。

次表面散射技术

传统渲染方法无法准确模拟光线与人类皮肤的交互,可能导致塑料般的外观。次表面散射(SSS)模拟光线如何穿透半透明材料表面并在内部散射,创造出更柔和、更自然的外观。开发者可通过本月底发布的RTX角色渲染SDK开始使用RTX皮肤和头发算法。RTX皮肤也将在RTX Remix中提供。

新一代硬件发布

NVIDIA今日为游戏玩家、创作者和开发者推出了新一代硬件——GeForce RTX 50系列台式机和笔记本电脑GPU。伴随这些GPU,NVIDIA推出了NVIDIA RTX Kit,这是一套神经渲染技术套件,用于通过AI进行光线追踪游戏渲染、渲染具有巨大几何复杂度的场景,以及创建具有逼真视觉效果的游戏角色。

RTX神经着色器

25年前NVIDIA推出了GeForce和可编程着色器,开启了从像素着色到计算着色再到实时光线追踪的二十年图形技术创新。伴随基于NVIDIA Blackwell架构的新款GeForce RTX 50系列GPU,NVIDIA推出了RTX神经着色器,将小型神经网络引入可编程着色器,开启了图形创新的新时代。

“微软很高兴与NVIDIA合作,通过为神经着色技术提供全行业支持来催化下一代图形编程。DirectX很快将支持协作向量,这将释放NVIDIA GeForce RTX硬件上Tensor Core的强大能力,使游戏开发者能够在Windows上完全加速神经着色器。”
Diagram showing how to train game data and shader code.
突破性应用技术

这项突破性技术用于三个应用:RTX神经纹理压缩、RTX神经材质和神经辐射缓存(NRC)。
RTX神经纹理压缩使用AI在不到一分钟内压缩数千个纹理。它们的神经表示被存储或实时访问,或直接加载到内存中而无需进一步修改。在相同视觉质量下,神经压缩纹理比传统块压缩纹理节省高达7倍的VRAM或系统内存。
RTX神经辐射缓存使用AI学习多反弹间接光照,在路径追踪光线初始一两次反弹后推断无限次反弹。与没有辐射缓存的路径追踪光照相比,这提供了更好的路径追踪间接光照和性能。

跨越数字人类渲染的恐怖谷

渲染人脸是实时图形中最具挑战性的任务之一,因为人们天生就能注意到与现实最微小的偏差。RTX神经面部提供了一种创新的新方法,使用生成式AI提高面部质量。
开发者可在本月底通过NVIDIA RTX Kit开始使用RTX神经着色器和RTX神经纹理压缩SDK。

Image of dragon showing the results of RTX Mega Geometry.
查看全文: 点击查看原文 |
⏰ 发布时间: 2025年01月23日