科技日报记者 都芃
“双十一”落下帷幕,各大电商平台交易量大幅上涨。这背后,离不开各类信息技术的有力支撑,拍立淘功能正是其中的典型代表。在“淘天集团算法技术”公众号上,有一群活跃的程序员,他们热衷于用文字分享算法技术的最新成果。
2014年,拍立淘功能上线淘宝App首页,打开了人们通过图像搜索进行网络购物的窗口,带来了视觉搜索领域的创新变化。
淘天集团拍立淘算法负责人柯思回忆说:“与当时侧重于广泛视觉应用场景下的图像检索方案不同,拍立淘选择了一条更为专精的道路——专注于实现同款商品图片搜索功能。这就要求我们在算法设计上达到前所未有的精准度。”
当时在产业界和学术界并没有图像搜索的应用先例,技术团队面临的最大难题在于加快突破图像搜索技术逻辑。文本语言与视觉语言有着天然的区别,视觉符号往往比文字更能呈现出直观、形象的视觉体验效果。
为了推出图像搜索,团队在电商领域对图像分类、目标检测以及图像表征技术进行了深入研究。图像分类技术能够使系统准确识别出图片中的商品类别;目标检测则帮助定位并识别图片中具体商品的位置与边界;而图像表征技术则是通过学习高维特征向量来表达每一张图片的独特性,从而支持高效精准的相似度匹配。这三项技术相辅相成,共同构建了图像检索引擎,为拍立淘应用提供了技术基础。经过一系列研发、测试以及迭代优化,拍立淘终于在2014年正式面世。
为了能够让平台图搜更快、更精准,此后团队又对拍立淘图搜AI技术进行了全链路重构。2021年,算法团队在行业内率先将核心召回和相关性向量表征等模块由单模态升级到多模态,并置于图文对齐预训练技术的统一框架下。
进入2024年,迎着风口,团队开始尝试让AIGC(生成式人工智能)在拍立淘中运用。例如,该如何搭配服饰以及体验试穿效果,一直是电商平台服饰类购物中十分核心的问题。凭借长期以来在服饰类目中积累的多模态理解能力和AIGC生成能力,团队为这个痛点提供了解决方案,即通过AIGC低成本大规模制作个性化服饰内容,最终达到理想效果。
从创建之初每天仅有数百位访客,到现在日均访问量突破5000万。十年来,拍立淘算法团队坚持技术自研,不断推陈出新,用技术为用户带来更好的电商购物体验。