【AI】【提高认知】卷积神经网络:从LeNet到AI淘金热的深度学习之旅
杨立坤的LeNet是卷积神经网络(ConvNets)在现代人工智能中的第一个成功应用,它为未来的深度学习奠定了基础。LeNet结合了神经认知机的想法与反向传播算法,凭借手写数字识别在商业上获得了显著成功。从20世纪90年代到21世纪初,LeNet被美国邮政局用于自动识别邮政编码,也被银行业用于自动读取支票上的手写数字。它的应用标志着卷积神经网络技术的首次商业突破。
然而,ConvNets的真正飞跃是从PASCAL竞赛和ImageNet开始的。PASCAL竞赛每年都吸引着众多计算机视觉研究者,激励了这一领域的突破性研究。令人意外的是,即便是顶尖的模型,识别盆栽植物依然是一个艰难的挑战,展现了视觉识别的某些独特难点。普林斯顿大学的年轻教授李飞飞则在不断思考如何改进图像识别的基础数据。一次偶然的机会,她了解到心理学家乔治·米勒主持的WordNet项目,这个项目将英语单词进行分组并以层次结构排列。李飞飞受到启发,构想了一个包含图像的数据库——ImageNet,其中每个名词与大量包含该名词示例的图像相关联。她的目标是通过大量数据的标注,帮助计算机学会理解复杂的图像世界。
为实现ImageNet项目的目标,李飞飞依赖于亚马逊的“土耳其机器人”服务,这个服务被称为“需要人类智慧的工作市场”。ImageNet项目中的图像标注任务被外包给了全球各地的工人,他们用10美分的报酬帮助完成了这项需要人类智慧但对计算机极其困难的工作。这正验证了明斯基的名言——“容易的事情做起来难”,对人