今日科普|人工智能的“眼睛”,计算机视觉如何看懂世界?

王铭俊   湖南日报   2026-04-30 19:09:10

手机解锁、扫码支付、自动驾驶、美颜拍照,这些大家习以为常的功能,背后都藏着人工智能的核心技术——计算机视觉。

它就像人工智能的“眼睛”,让机器能像人眼一样“看懂”世界,识别图像和视频中的物体、场景,甚至理解背后的含义。

计算机视觉是如何看懂世界的?今日科普,与你一起了解。

湖南日报全媒体记者 王铭俊 通讯员 黄芳淮

【知识多一点】

当手机瞬间解锁、汽车自动避让行人时,背后都是计算机视觉在发挥作用。作为人工智能的核心分支,它如同给机器装上了“眼睛”,让冰冷的设备具备了理解世界的能力。

对人类而言,80%的外界信息来自视觉;而对计算机来说,图片最初只是由0和1组成的数字矩阵。计算机视觉的使命,就是通过算法从这些数字中提取有效信息,识别物体、场景甚至动作,最终实现“看懂”的目标。

这项技术的发展经历了质的飞跃。早期要靠工程师手动设计边缘、纹理等特征,再用分类器识别,精度有限且难以应对复杂场景。2012年后,深度学习尤其是卷积神经网络的出现,彻底改变了格局。它能模仿人类视觉皮层,自动学习图像特征,如今在图像识别任务上的准确率已超越人类肉眼。

从原理上看,计算机视觉的工作流程环环相扣:先通过摄像头采集图像,经过去噪、增强等预处理提升质量;再通过算法提取边缘、纹理等关键特征;最后完成图像分类、目标检测、图像分割或目标跟踪等核心任务,输出实际应用结果。

参考文字来源:

科普中国

责编:李传新

一审:王铭俊

二审:杨丹

三审:杨又华

来源:湖南日报

我要问