一分钟创建能看、会听、可说的AI数字分身!

随着大模型的发展,AI的智能水平也越来越高,谷歌最新推出 Gemini 模型,该模型具有原生多模态、更复杂推理能力!

Gemini 视频演示:How it’s Made: Interacting with Gemini through multimodal prompting[https://developers.googleblog.com/2023/12/how-its-made-gemini-multimodal-prompting.html]

该模型pro版本可以在bard体验,但也是仅对部分国家和地区开放。创建多模态模型的常规方法是训练不同模态的单独组件,然后将它们组合起来,通过额外的多模态数据进行微调,以提升其效果。

国内我们也可以利用插件来“武装”大模型,以较低成本来打造一个能看、会听、可说的多模态AI应用!比如,利用LinkAI平台,无需任何代码,即可快速打造一个AI数字分身,并可以快速接入微信/公众号/企微/飞书等移动端平台!

平台介绍

LinkAI是一站式的AI应用平台,聚合文本、语音、图像等多模态基础模型,在此基础上提供知识库定制化、联网搜索等增强服务及丰富插件,基于开源生态和开放接口帮助开发者快速完成应用接入为企业提供一站式服务

创建应用

点击官网右上角的登录,微信扫码或者手机号进行注册。

然后我们可以看到应用广场,这里显示的是“造梦师”、“文案专家”、“周公解梦”等各种有趣的AI应用,覆盖了日常的方方面面,大多都是通过**应用设定(system prompt)**来创作的,可以在这里体验体验别人的创意,然后我们可以创建自己的AI应用(应用发布到广场来可以赚积分)。

我们点击上图左侧的创建,来到LinkAI控制台,然后点击创建应用,这里我们以创建库里数字分身为例来看看如何打造个人数字分身。

我们选择知识库应用,知识库应用相比轻应用来说,可以上传文档供AI学习,更适合用于打造数字分身。我们填入应用名称应用描述后,点击AI一键填写,不需要任何基础即可快速完成应用设置。也可以根据需要继续优化应用设定,这个就是所谓的人格角色设定

在底部点击直接上传文件,可以选择无结构文档QA问答格式

  • 无结构文档:无需进行任何预处理的原始文档,LinkAI会帮你进行文档拆分和加工,支持 pdf、docx、md、txt 格式的文件。
  • QA问答格式: 一问一答形式的语料,需要按照模板 进行预处理,支持 csv 格式。

我们可以直接上传和欲创建的数字分身相关的无结构文档即可,比较省事,后续也可以不断补充优化,采用QA格式效果更好!最后点击创建即可!

使用&探索

我的应用界面,找到刚刚创建的应用,点击开始对话即可使用

我们可以在右上角选择模型插件、以及语音对话,这些配置我们可以在应用里进行详细设置:

我们需要什么功能在插件配置中添加相应的能力即可。此外,我们在移动端h5页面使用语音对话体验更好!

至此,一个能看、会听、可对话的AI数字分身创建完成。通过LinkAI平台强大的知识库功能,打造的AI数字分身可以在生活、教育、医疗、亲子等方面发挥极大的作用,带来有趣的体验和效率的提升!

更多高级玩法

我们除了在网页端直接使用外,我们可以通过平台的开源项目ChatGPT-On-WeChat,将应用广场上的和自己创建的应用快速接入到微信/企微/公众号/飞书等移动端平台;还可以通过开放API,将应用嵌入到自己的生态当中,快速高效为自己的产品生态接入AI能力,扩展性极强!

应用接入参考:https://docs.link-ai.tech/platform/link-app

开放API:https://docs.link-ai.tech/api#/

也可以参考往期博客来查看其他功能和接入教程,以及访问个人网站获得更多信息:wangpc.cc