今日科普｜人工智能的“眼睛”，计算机视觉如何看懂世界？

王铭俊湖南日报 2026-04-30 19:09:10

手机解锁、扫码支付、自动驾驶、美颜拍照，这些大家习以为常的功能，背后都藏着人工智能的核心技术——计算机视觉。

它就像人工智能的“眼睛”，让机器能像人眼一样“看懂”世界，识别图像和视频中的物体、场景，甚至理解背后的含义。

计算机视觉是如何看懂世界的？今日科普，与你一起了解。

湖南日报全媒体记者王铭俊通讯员黄芳淮

【知识多一点】

当手机瞬间解锁、汽车自动避让行人时，背后都是计算机视觉在发挥作用。作为人工智能的核心分支，它如同给机器装上了“眼睛”，让冰冷的设备具备了理解世界的能力。

对人类而言，80%的外界信息来自视觉；而对计算机来说，图片最初只是由0和1组成的数字矩阵。计算机视觉的使命，就是通过算法从这些数字中提取有效信息，识别物体、场景甚至动作，最终实现“看懂”的目标。

这项技术的发展经历了质的飞跃。早期要靠工程师手动设计边缘、纹理等特征，再用分类器识别，精度有限且难以应对复杂场景。2012年后，深度学习尤其是卷积神经网络的出现，彻底改变了格局。它能模仿人类视觉皮层，自动学习图像特征，如今在图像识别任务上的准确率已超越人类肉眼。

从原理上看，计算机视觉的工作流程环环相扣：先通过摄像头采集图像，经过去噪、增强等预处理提升质量；再通过算法提取边缘、纹理等关键特征；最后完成图像分类、目标检测、图像分割或目标跟踪等核心任务，输出实际应用结果。

参考文字来源：

科普中国

作者：王铭俊

责编：李传新

一审：王铭俊

二审：杨丹

三审：杨又华

来源：湖南日报

我要问