AI从炫技术到创造商业价值有几步?印奇详解旷视

作者:mile官网 日期:2025-11-16 浏览: 来源:mile米乐集团

AI从炫技术到创造商业价值有几步?印奇详解旷视“2+1”AIoT核心技术科研体系

印奇提出,技术变革的路径可以分成两步:先真正产出高质量的技术,接着让这些技术为客户创造实际价值。 在一次关于AI视觉前沿的分享中,旷视的研究团队围绕AI视觉的最新进展与未来趋势展开探讨,并现场呈现了多项最新应用场景,包括瞬时相机、VR裸手交互、低功耗嵌入式L2自动驾驶等,引发广泛关注。 他强调,AI是公司的核心能力,物联网是实现商业价值的载体。要让AIoT落地,需要具备三要素:在AI端的基础算法科研与规模化量产,以及在IoT端以计算摄影为核心的算法定义硬件。这一“2+1”的组合构成旷视持续推进AIoT商业化的关键基石。 关于视觉AI基础模型的新趋势,专家指出当前的主线是“大”和“统一”两大方向。所谓“大”,指借助海量数据、强大算力与庞大参数来提升模型的表达能力,使其能够覆盖多任务、多数据与多场景;所谓“统一”,则是在视觉基础研究、基础应用和算法演化等领域寻找底层的共性,推动不同研究路径在底层实现趋同。需要提醒的是,模型越“大”并不必然越好,边际效应递减的现象需要警惕,关键在于让大模型的优势真正转化为实际应用的能力。 在旷视对“大”和“统一”的理解下,基础模型的研究与应用被划分为四大方向:一是通用图像大模型,聚焦构建高性能、通用且统一的图像视觉大模型;二是视频理解大模型,破解长序列建模与高效训练、监督及应用的难题;三是计算摄影大模型,围绕对图像退化模式的建模来实现高质量图像生成;四是自动驾驶感知大模型,致力于简化、统一、高效的自动驾驶感知模型的优化、训练与部署。 关于AI算法的量产,旷视提出的不是简单的批量化生产同一种算法,而是能够批量产出多种适用于不同场景的算法。为此,算法量产平台AIS应运而生,形成一站式的MLOps生产体系,覆盖从数据清洗、智能标注、数据管理、质检,到算法自动生产、模型评测、以及流水线部署等全流程能力。该平台已支持广泛的模型训练,训练时长可控在数小时级别,并具备高于行业平均水平的精度指标;其中的自动部署工具可一键将训练好的模型转换到不同计算平台并进行对比测试,大幅简化从训练到落地的流程。 在“算法定义硬件”的愿景下,传感器不再只是单纯的输入设备,而是与算法深度耦合的桥梁。计算摄影的进步使得智能设备在拍照质量上获得质变,例如在夜景与低光环境中的成像能力显著提升。未来还将推出8K级“AI画质”方案,并继续推动16K AI极超高清的愿景,力求通过AI、传感与显示三者的联动带来沉浸式的观看体验。同时,传感器将朝着更小型化、低功耗方向发展,与日常生活和个人需求的结合将更加紧密。 mile米乐 现场展示的瞬时相机通过将自研图像去模糊算法与事件相机的实时信息相结合,并借助深度学习对运动模糊区域进行重建,成功实现了高速场景的清晰成像,显著提升在低光环境下的成像表现。 印奇总结道,“技术信仰、价值务实”是旷视的人才观与价值观,而AIoT的核心技术科研体系则是未来十年、二十年持续坚持的方向。