手机里存了成千上万张照片,当你想找一张图片时,可能要在图库中翻找好久,有时候,你想要查找一些跨越时间节点的图片,比如:孩子从小到大弹琴的照片和视频,就更加困难了。
在这种情况下,基于荣耀魔法大模型的AI语义搜图功能,能够帮助我们快速搜索,只需用自然语言描述图片内容,就能高效识别,查找出相关图像。相比传统的搜图技术,荣耀语义搜图在技术与体验上实现了突破式升级。
传统的搜图技术效率太低了
传统的手机图片搜索功能,大多是基于标签分类的计算机视觉技术,你只能通过输入时间、人物、地点等关键词找到特定照片。但是,当你无法准确地回忆起时间、地点,只有关于照片的模糊记忆时,比如“和妈妈一起在海边游玩的照片”,查找照片的效率就会急剧降低。面对这种复杂或模糊意图的图片搜索时,荣耀是如何应对的呢?
AI语义搜图,精准查找你想要的那张图
只记得照片的某些抽象特征,没关系,将想象中的那张图片用自然语言描述出来,系统就会筛选出和语义接近的图片。这就是荣耀在MagicOS 8.0上推出的AI语义搜图功能,在荣耀魔法大模型的图像语义理解能力的加持下,只需要用自然语言描述画面内容特征,系统就能理解用户意图,快速找到所需图片或视频。
你可以用自然语言来描述想要搜索图片的画面内容,例如,输入“盛开的荷花”、“去年夏天在海南冲浪”、“玩耍的小猫”等描述性的文字进行搜索。
除了精准高效地搜索图片,荣耀还在业界首次实现了语义搜视频,支持定位到画面所在的帧,点击就能跳转到对应画面查看。当你想要查找跨越时间节点的视频素材时,例如,找到孩子不同时期跳舞的视频片段,轻松定位相关素材剪辑成一部跳舞短片。
荣耀语义搜索不仅对复杂语义能精准识别和理解,还支持基于图像语义整合理解人物关系,分析人物年龄、性别、穿着、动作和姿势等,识别人物亲密度,整合理解人物关系,如:情侣、母子、闺蜜等,学习和记忆人物关系,可以搜得更准。
虽然看上去是一个很小的搜图功能,但是这背后却包含了荣耀在AI领域的技术沉淀与能力创新,究竟荣耀在技术上突破了哪些难点?
荣耀在语义搜图上的技术突破
1.构建了全新的多模态模型算法
荣耀全新的多模态模型算法,通过文本向量和图像向量相似度的比较,计算输出匹配度最高的图片。通过利用互联网上已经存在了大量的图像文本对进行训练,获得泛化能力较强的模型。同时,荣耀通过自有海量高质量训练数据构建,减少互联网数据的噪音,提升理解的准确性,利用专有场景模型微调,降低训练数据偏置及噪声影响,优化常见视觉元素的识别,提升高频专有类别识别性能。
2. 多模态模型算法的端侧部署
荣耀采用模型压缩技术,用更低的bit表达原始模型信息,并裁剪冗余信息,在保证模型精度的前提下,降低模型的计算量。此外针对芯片优化适配,荣耀针对性地采用算子融合、多头自注意力机制并行计算等硬件友好的方案设计,最大程度释放芯片的性能,成功将多模态模型算法部署在手机设备上。
3. 自研轻量级向量检索引擎
荣耀面向端侧场景自研轻量级向量检索引擎,支持对海量数据进行向量索引构建,且支持时空语义,人物关系一站式融合检索,可以便捷、高效地通过 Query语义特征找出匹配的照片。荣耀在手机端采用增量实时写入持久化的索引数据库中,同时采用索引分段能显著降低单次插入索引时间,通过定期进行压缩合并,完成已删除数据占用内存及磁盘资源的回收,达到了显著降低资源开销的目的。
开放核心能力,共建智慧生态
与生态伙伴一起,利用大模型的能力,给用户带来更加智慧化与创新的服务体验,一直是荣耀开放生态的态度。语义搜索的能力已经开放给三方生态伙伴,目前,钉钉已经接入并且可以体验,后续将有更多三方应用陆续加入。
语义搜索不过是荣耀魔法大模型众多魔法体验的冰山一角,随着不断提升的大模型能力和技术水平,荣耀将会为用户带来更多智慧能力和服务的越级体验。
*不同机型、版本对上述功能的支持情况各有差异,请以实际为准
*文中视频、文字、图片、音效及产品屏幕内容仅用于说明产品功能,请以实物为准。
*语义搜图除了支持荣耀Magic6系列,也支持荣耀100系列产品,后续将在更多产品上线,请以实际体验为准。
Copyright © 2024 妖气游戏网 www.17u1u.com All Rights Reserved