对话硅基智能:数字人技术如何重构跨境电商内容生产与用户交互 AI竞争力访谈
当TikTok Shop和Temu们将中国供应链的“效率神话”复制到全球时,一个更深层的挑战浮出水面:如何在语言、文化、人力成本三重壁垒下,实现营销内容的大规模个性化生产?传统解决方案——跨国组建拍摄团队、高价聘请本地网红、多语言视频剪辑——在“快时尚式”的电商竞争中已显得笨重且昂贵。
“全球电商的竞争正在从供应链效率转向内容生产效率。”硅基智能产品经理白晞在亿邦动力专访中直言。这家估值近10亿美元的AI公司,近期因两项动作引发行业关注:在GitHub开源全球TOP级数字人模型HeyGem,以及即将推出“10秒生成带货视频”的AI工具Toolwiz。其背后逻辑直指出海企业的核心痛点:当Z世代消费者将“与虚拟KOL互动”视为常态时,品牌需要更轻量化、低门槛的AI武器。
而硅基智能的定位折射出AI行业的范式转移。2017年成立时,其以“数字人克隆”技术切入市场,彼时行业尚在探索基础语音合成与僵硬的表情驱动;而随着2023年生成式AI爆发,数字人技术迅速迭代至“多模态交互”阶段——在硅基智能的演示中,HeyGem模型仅需1秒视频即可克隆形象与声音,30秒生成4K超清数字人,且支持8种语言的音色输出。这种“秒级生产”能力,正在解构传统内容制作流程。
“过去跨境电商拍一条德语带货视频,需要找德国模特、租场地、后期剪辑,成本可能超过10万元。现在用Toolwiz上传商品图,AI能自动生成德国本土面孔的模特手持商品讲解的视频,成本几乎为零。”白晞举例称。这种变革对中小出海企业尤为关键:据硅基智能数据,使用其数字人技术的企业内容成本平均下降70%,某美妆品牌通过AI生成300条本土化视频后,TikTok转化率提升2倍。
围绕“全球化新品牌需要怎样的AI竞争力”的主题,亿邦动力邀约众多跨境服务企业进行系列访谈,分享其如何应用AI技术提高服务出海企业的水平,帮助出海企业提升综合竞争力。以下为亿邦动力与硅基智能产品经理白晞的访谈内容,经编辑整理。
白晞:南京硅基智能科技有限公司成立于2017年,定位为全球领先的AIGC数字人技术开创者,以“为世界创造1亿硅基生命”为使命。公司核心业务聚焦于数字人技术研发与开源生态建设,推动数字人技术在政务、医疗、跨境电商、教育等领域的普惠化应用。
在大模型+数字人的技术支撑下,公司成为数字人商业应用领域的领航者,在知识生产(视频)、知识传播(直播)、知识创作(文娱)等多个领域,克隆了超过50万的数字人律师、老师、医生、企业家、博主等,实现了AIGC产品在十多个行业数十个商业化场景的落地应用,数字人市场占有率稳居全国第一,同时已在海外市场开展多项业务合作。
成立至今,公司发展迅速,已成为工信部国家专精特新小巨人企业、国家高新技术企业,在我国各大人工智能、AIGC相关品牌榜单名列前茅。公司高度重视技术及创新发展,算法等研发人员占员工总数的70%以上,研发费用持续3年过亿。截至目前已拥有知识产权300余件,其中发明专利授权137件,其中包括数十项全球专利。在技术及市场的支撑下,公司屡获资本青睐,获得了包括腾讯、招银国际、国新央企、海松资本、红杉资本、浦信资本、奇虎360等机构投资,最新估值近10亿美元。
亿邦动力:你们的产品及其核心应用场景是什么?怎么帮助全球化品牌/出海企业提升竞争力、解决业务痛点、重构运营方式?
硅基智能即将上线的智能广告生成工具,颠覆了传统广告制作模式,仅需上传产品图片,选择人物模板并配上合适的脚本文案,在10秒内即可生成达人介绍产品的高质量视频,帮助品牌商家、内容创作者、带货达人快速打个性化的AI代言人,实现高效、低成本的营销内容生产。无需专业技能和昂贵的拍摄设备,任何人都能轻松使用,轻松生成高质量带货视频。平台向用户提供手持商品图,以及商品图放在模特周边两种类型的素材模版,还有海量AI生成的人物模版,同时客户可以定制上传人物形象,自主定制模特,可支持20+种不同语言。
轻松高效,节约成本:过去制作产品推广视频,常常要耗费数小时甚至数天时间。有了Toolwiz,一切变得无比简单。你只需上传产品图片,从我们丰富多样的人物模板中挑选合适的,再添加恰当的脚本内容,短短10秒,就能生成一条由虚拟达人介绍产品的高质量视频。无论你是品牌商家、内容创作者,还是带货达人,Toolwiz都能助力你快速打造个性化的AI代言人,实现高效且低成本的营销内容制作。
低门槛,无需专业技能:无需具备视频制作的专业知识,也无需拥有昂贵的拍摄设备。Toolwiz的设计理念就是简单易用,面向所有人。即便你毫无视频编辑经验,也能轻松制作出可与专业团队媲美的一流产品推广视频。
丰富模板与定制选项:Toolwiz提供手持商品图,以及商品图放在模特周边两种类型的素材模版,还有海量AI生成的人物模版。不仅如此,用户还可以定制并上传人物形象,为品牌打造完美的形象代言人。
多语言支持:借助Toolwiz,触达全球受众变得轻而易举。平台支持20多种不同语言。重点面向欧美及东南亚市场,轻松打破语言障碍,增强客户互动,真正实现无国界交流。
出色算法表现:我们先进的算法能确保在生成的视频中,上传产品图片的图案和字迹清晰,无变形或乱码情况。这意味着你的产品始终能以最佳状态呈现,保持专业形象。
免登录及免费试用:使用Toolwiz时,用户无需先登录即可开始使用服务。快速、简便又便捷,让你能直接投身于营销视频的创作。若用户选择登录,每月还将获得免费积分,可制作个性化营销视频。
今年3月硅基智能在GitHub开源全球TOP级数字人模型HeyGem,同时发布基于该模型的同名数字人工具硅基数字人克隆的本地安装包,标志着数字人技术进入秒级克隆、无限量使用、全离线推理生成的新时代。与传统数字人训练需要数小时甚至数天的模式相比,硅基数字人克隆实现了极限压缩,仅需1秒视频即可完成数字人形象和声音的克隆,30秒内完成数字人克隆,60秒内合成4K超高清数字人视频,在复杂光影、侧脸、遮挡等场景下仍能保证100%口型匹配,输出多表情多肢体动作数字人视频。
在实际应用中,硅基数字人克隆支持无限时长的4K超高清数字人视频生成,能够通过语音或文字输入驱动,克隆后的数字人音色支持8种语言输出,为跨国企业、在线教育、影视制作、直播营销等多场景提供更高效、更低成本的解决方案。无论是需要批量生产AI虚拟主播、打造个性化智能客服,还是用于品牌代言、广告营销,硅基数字人克隆都能以秒级的响应速度和行业领先的精度,满足不同场景对高质量数字人的需求。凭借顶级口型同步技术,在复杂光影、遮挡或侧面角度下依然能实现高度逼真的发音匹配,使得数字人视频的自然度进一步提升,接近线、DUIX交互平台
DUIX是一个专为“数字人实时交互”打造的智能平台,具备“能听、会说、懂你”的三重感知能力。不同于传统依赖云端渲染的重型解决方案,DUIX经专利级模型压缩后,可轻松部署于手机、平板、车载等终端,保持50 FPS高帧率运行,实现低延迟、丝滑自然的对话体验。其高精度的动作捕捉、唇形同步与微表情模拟,让交互过程逼真近人,真正打破“像人但不懂人”的交互困境。
并且DUIX是一套对开发者与企业都极度友好的产品体系。开发者只需三行代码,便可将智能数字人嵌入任何产品中,并灵活接入所选的大语言模型、语音识别/合成模块,自由打造个性化语义与情感交互体验。这一“开箱即用”的能力,让传统上需依赖重开发和云算力的数字人落地,变得轻量而高效。DUIX目前已开放多端部署能力,支持Android、iOS、网页与嵌入式平台,满足B 端客户对可控性、安全性与定制化的全方位要求。企业可以基于DUIX快速构建专属数字员工、智能客服、交互式虚拟代言人或陪伴型AI角色,无需搭建底层系统,即可借助开源生态优势实现成本可控、体验领先、快速上线。
对于全球化品牌和出海企业而言,首先能极大降低内容创作成本。以往制作高质量的宣传视频等内容,需要投入大量的人力、物力和时间成本,现在利用我们的数字人技术,能快速生成各种营销素材,提升内容产出效率。比如一些跨境电商企业,通过HeyGem快速制作数字人视频,结合Toolwiz的技术低成本地生成海量达人带货视频,在各大平台进行投放,吸引全球消费者,有效降低推广成本。其次,解决语言沟通障碍痛点。
硅基数字人音色支持多国语言输出,例如,一家面向东南亚和北美市场的跨境电商企业,通过使用这些技术,可以让数字人主播或客服以当地消费者熟悉的语言进行产品介绍和解答疑问,打破语言壁垒,增强消费者对品牌的亲近感和认同感,有效提升沟通效果和客户满意度。再者,重构运营方式方面,企业可以在本地搭建属于自己的AI内容生产体系,摆脱对外部昂贵制作团队的依赖,实现更自主、高效的运营。例如,一些跨国企业利用我们的技术打造个性化智能客服数字人,为全球不同地区的客户提供24小时不间断服务,提升客户服务体验和运营效率。
亿邦动力:大模型及生成式AI技术的快速发展给你们的产品带来了哪些变化/升级/重塑?(AI技术的应用是如何改变你们这个行业/这类服务型产品的?)
借助先进的大模型技术,硅基数字人克隆更加精准和高效。以前数字人克隆可能需要较多的数据和较长的训练时间,现在通过大模型的赋能,像HeyGem仅需1秒视频就能实现高精度的形象克隆,并且在声音克隆方面,基于先进的语音合成大模型,能够精准复刻各种音色,包括说话者的语调、停顿、气息等细节,让数字人的声音更加自然、生动。
在复杂光影、侧脸、遮挡等场景下,大模型强大的理解和处理能力,使得硅基数字人仍能保证100%口型匹配,并且呈现出自然丰富的面部情绪及肢体动作。这是因为大模型可以对输入的文本或语音进行深入分析,从而更准确地驱动数字人的口型和表情变化,使其表现更加逼真,接近线、应用场景拓展:
生成式AI技术让硅基数字人产品能够拓展到更多的应用场景。比如在跨境电商领域,多语言的数字人带货视频可面向各大平台精准投放及传播,在直播中数字人也可以根据直播的主题和氛围,实时生成相应的内容和表现,与观众进行互动;在金融领域,数字人可提供24小时在线问答、IM电竞平台账户查询、理财建议等服务,还可以通过短视频普及金融知识,增强用户信任感;在医疗领域,AI医生(如硅基x盘古医学大屏)可以解读体检报告、模拟专家问诊,并提供个性化健康方案;在政务领域,在服务大厅部署数字人,引导市民办理社保、税务等业务,如硅基智能打造的南京政务数字人“诗雨”;在教育领域,虚拟教师(如硅基智能打造的“小北老师”)提供个性化服务,实时答疑并生成互动课件,支持8种语言输出的数字人,还可以为偏远地区提供优质外语教学资源。
自2017年成立以来,我们始终坚持对技术研发的高投入,每年研发投入占比高达70%。大量的资金投入吸引了众多优秀的技术人才。硅基智能长期深耕AIGC赛道和数字人产业,持续进行技术攻关,历经多年研发推出了一系列领先的数字人技术和产品。
我们在数字人技术领域拥有深厚的技术积累,早在2019年就成功申请下了全球第一项数字人技术专利。截至目前,已拥有授权专利137件,包含近30项海外专利。这些专利涵盖了数字人技术的多个核心方面,为产品的技术优势提供了坚实保障。
硅基智能长期积极推动开源生态建设,通过开源DUIX和HeyGem,吸引了全球开发者的参与和贡献。在GitHub上收获了大量的关注和星标,众多开发者在开源代码的基础上进行定制化开发,不仅丰富了数字人技术的应用场景,也促使我们不断优化和改进技术,形成了良好的技术发展生态。
亿邦动力:从你们所处的行业环节来看,全球化品牌/出海企业对于AI技术、AI工具的应用程度和效果如何?这个过程涉及哪些变化和挑战?
全球化品牌和出海企业对AI技术、AI工具的应用程度正逐渐加深。在营销方面,很多企业利用数字人技术制作宣传视频、开展虚拟直播等,取得了不错的效果。例如一些美妆品牌通过数字人主播进行产品展示和讲解,吸引了大量消费者的关注,提升了产品销量。在客户服务领域,AI客服数字人的应用也越来越广泛,能够快速响应客户咨询,提升客户服务效率和满意度。一些跨境电商企业采用我们的数字人技术后,运营成本降低了30% -50%,同时客户转化率也有显著提升。企业的运营模式逐渐向数字化、智能化转变,更加注重通过AI技术提升效率和用户体验。
像Toolwiz这样的智能广告生成工具,能快速生成高质量的营销视频,大大提高了内容生产效率,降低成本。企业无需专业团队和昂贵设备,就能制作出大量个性化的推广内容,有助于品牌在全球范围内快速传播。
比如通过AI算法分析消费者行为和偏好,跨境电商企业可以实现精准营销和个性化推荐。同时,DUIX等智能平台让数字人能够与用户进行自然、流畅的交互,提供个性化的服务体验,增强用户粘性和品牌忠诚度。
硅基数字人克隆等技术可应用于直播营销、智能客服等多个场景,以更低的成本实现24小时不间断服务。例如某酒旅行业头部品牌运用硅基智能的数字人直播,2023年GMV已超过10亿元。此外,AI在库存管理、物流配送等方面的应用也能优化资源配置,降低运营成本。
AI技术助力企业更好地了解不同国家和地区的市场需求、文化特点和消费习惯。如Toolwiz可支持20多种语言,企业能更轻松地进入全球各个市场,实现品牌全球化。
另外,在未来发展趋势上,数字人将更加智能化和个性化,能够与消费者进行更加自然、深入的交互,成为品牌与消费者沟通的重要桥梁。
AI技术将与大数据、云计算、区块链等技术进一步融合,为跨境电商提供更全面、高效的解决方案。
数字人技术会不断发展和普及,其应用场景将进一步拓展到产品设计、售后服务、员工培训等更多领域。数字人不仅会更加逼真、智能,还能实现多模态交互,为用户带来更丰富的体验。
随着AI技术在跨境电商领域的广泛应用,相关的法律法规和行业标准将逐步完善。
AI走进商业现实,品牌和跨境电商打头阵,2025全球化新品牌AI竞争力大会,6月6日定档杭州。本次大会以“进化抉择”为主题,由亿邦动力与嘉御资本联合主办。欢迎扫码报名: