Al动嘴的时代,创意文稿谁还用手写。上海人工智能实验室推出了首个图文混合创作大模型
「书生 •浦语灵笔」,三步就能生成图文并茂的神作,现正式开源。
解放双手,动嘴的时代真的来了。
当你想写一份 「原神」的宣传文稿时,根本完全不用上网翻找收集各种材料,只需要给模型
一个指令「帮我以原神为题写一篇文章」。
游戏背景现、上市时间、影响力等要点已经成文。接下来,你还可以让 LLM 自动插入趣味、生动的配图。
一眨眼的功夫,专属定制的神作就完成了。
那么,究竟是什 么模型有如此神力?
它就是,书生•浦语灵笔 (nternLM-xComposer,以下简称「浦语灵笔」)。这是上海人工智能实验室(上海 Al 实验室)推出的首个图文混合创作大模型。
依托强大的多模态性能,可以解锁「一键生
成」图文混合文章的创作能力,为大模型落地
应用提供更多可能。
目前,浦语灵笔已开源其中的智能创作和对话
(InternLM-XComposer-7B)及多任务预训练
(InternLM-xComposer-VL-7B)版本,并提供免费商用。
今年7月以来,上海 Al实验室陆续开源了书生•浦语大语言模型的 7B (InterLM-7B)及 20B(internLM-20B)版本,为业界提供了完整的大模型研发与应用基座,以及全链条工具体系。
基于书生•浦语大语言模型 (internLM),浦
语灵笔接受祝觉和语言模态输入,不仅在图文
对话方面表现优秀,更具备图文并茂文章的
「一键生成」能力。
准确图文理解,一键图文并茂
浦语灵笔能够进行流利的中英文图文对话,准确理解图像内容。得益于书生•浦语高质量多
语言预训练的优势,浦语灵笔表现出对中国文化深厚的知识积淀。
例如,向浦语灵笔输入相关画作,其迅速识别
并反馈画作表现主题为 《赤壁之战》 典故,亦能准确介绍影响成败的关键因素,体现出在图像内容理解和知识储备方面的优秀性能。
在多模态图文对话的「基本功」之上,浦语灵笔更是解锁了图文并茂文章创作的全新能力。
大语言模型 (LLM)具备文本写作的能力,然而高质量文章往往需要准确且有趣的插图才
「更品生动」。
浦语灵笔团队将书生 .浦语强大的语言能力向多模态拓展,使其能够完成多模态文章创作。
用户仅需提供主题,便可一键生成图文并茂的文章,体验全新的视觉与文本创作范式。
例如,向浦语灵笔提出创作一篇旅游攻略,该
模型可迅速生成涵盖历史沿革、主要景点文物
介绍的长篇文章,并在适当位置自动插入与文字信息对应的图片。
除自动配图能力外,浦语灵笔还提供了配图推荐和更换功能,根据用户实际需求定制图文内容
目前,浦语灵笔已支持科普文稿、营销广告、新闻稿件、影视评论、生活指南等类型文章的图文并茂生成,并将逐渐开放更多能力,适应更多样化任务需求。