讯飞智作:科大讯飞旗下超1210万用户选择的AIGC一站式智能配音与虚拟人创作平台
讯飞智作是科大讯飞推出的AIGC内容创作平台,于2023年4月正式发布,定位为一站式智能配音与虚拟人应用服务平台。平台运用语音识别、语义理解、语音合成、NLP及星火大模型等AI核心技术,提供AI音频制作、AI视频生成、虚拟人形象构建与驱动、多模态交互等一站式服务。核心功能包括:AI配音(文字转语音,支持多语种多风格发音人)、虚拟主播播报(2步生成数字人视频)、数字分身定制(5分钟视频打造专属虚拟形象)、一句话声音复刻、AI分镜创作、PPT转视频、图文转视频等。平台提供300余个公共形象、1000余个创意模板及1000余个发音人资源,累计服务用户超1210万,聚集约500万AI创作者

在AIGC内容创作浪潮席卷各行各业的今天,视频内容的需求量呈指数级增长。然而对于大多数普通人来说,制作一条像样的短视频往往意味着要面对镜头紧张、不懂剪辑、不会配音、不会写脚本等一系列难题。科大讯飞推出的讯飞智作,正是为了解决这一痛点而生。
讯飞智作最核心的能力,在于其将科大讯飞深耕二十余年的智能语音技术,打包成了一款“人人可用”的视频创作工具。它于2023年4月26日在江苏南京的“八点见”项目发布会上正式亮相。这个平台的定位非常清晰:你不需要会出镜、不需要会剪辑、不需要会配音,只需要会打字,就能在几分钟内生成一条带有数字人主播的短视频。一位资深互联网从业者在深度体验后感叹:“我之前最怕录视频,对着镜头像被老师点名背课文的小学生。用了讯飞智作之后,15分钟就能出一条产品介绍视频,老板看完直接问我要链接。”自讯飞智作2.0发布以来,平台已新增超10万名专业用户,应用于新闻播报、教育培训等多个领域。
讯飞智作的第一个核心功能模块是AI音频制作,这源于科大讯飞作为全球语音技术领导者的深厚积累。基于其全球领先的TTS(文字转语音)技术,用户只需输入文本、选择发音人,即可一键生成专业级音频。平台提供超过1000个发音人资源,涵盖有声阅读、新闻播报、多语种及方言等多种风格。用户不仅可以调节音量、语速、语调,还能插入换气、连续、停顿等标记来精细调整合成韵律。对于追求更高品质的用户,平台还提供真人配音服务作为补充。
第二个核心功能模块是AI视频生成与虚拟主播播报,这也是讯飞智作最受用户欢迎的能力。用户只需两步:选择形象、输入文本,即可在3分钟内生成一条1分钟长度的虚拟主播播报视频。平台提供超过300个公共虚拟形象可供选择。生成效果的口型同步率和表情自然度令人印象深刻——据官方数据,其超拟人数字人技术的唇形同步率可达98%。这意味着观众在观看视频时,很难分辨屏幕里的主播是真人还是AI。一位房产中介在试用后,用手机5分钟就做了一条看房视频发朋友圈,第二天就有客户约看房。
对于追求个性化和品牌化的用户,讯飞智作提供了“数字分身定制”和“声音复刻”功能,让你拥有一个“数字孪生”的自己。在形象定制方面,你只需要上传5分钟的视频素材,平台即可自动构建你的专属虚拟数字分身。这个数字分身可以代替你出镜播报,为音视频创作缩减70%以上的时间及经济成本。在声音复刻方面,讯飞智作在2025年完成了“一句话声音复刻”的重要升级——你只需录制一句话,AI就能还原你的音色,让你拥有一个可以用你的声音说话的“AI分身”。这种“从声音到形象的完全自动化构建能力”,让每个创作者都能拥有自己的专属IP。
讯飞智作的第三个能力升级是AIGC工具链的深度整合,让“写稿、配音、出片”全流程自动化。平台在2025年完成了“AIGC内容创作适配”升级,实现了“AI帮写、智能配音、数字人匹配”的深度联动。你甚至可以直接导入PPT,系统会自动识别内容、匹配合适的数字人形象并生成视频。其AI分镜创作功能支持生成最长180秒的视频。这意味着从创意构思到成品输出,讯飞智作正在变成一个“全自动内容工厂”。
在技术底座层面,讯飞智作依托的是科大讯飞星火认知大模型与多模态核心技术。2023年8月15日,伴随星火认知大模型V2.0的发布,支持多模态能力升级的讯飞智作2.0正式亮相。2024年12月,讯飞AI虚拟人交互平台获中国信通院大模型数字人基础能力最高等级L5认证。2025年12月,该平台主导制定两项数字人ITU国际标准。2026年5月,该平台通过国家标准《信息技术 客服型虚拟数字人通用技术要求》全量功能测试,成为国内首个通过全量功能测试并获颁证书的客服型虚拟数字人平台。这一系列权威认证,验证了讯飞智作在情感智能、2D/3D形象生成、全链路交互等方面的技术实力。
在商业化方面,讯飞智作采用了分层定价策略,试图覆盖从个人创作者到企业级用户的多元需求。针对想要尝鲜的个人用户,平台提供30元的一次性通用尝鲜包,约可生成20条视频,这个门槛远低于市场上大多数数字人工具。对于有持续配音需求的用户,配音会员45元/月(3个月108元,12个月308元),可免费使用合成配音VIP主播并导出。对于需要虚拟主播视频制作的进阶用户,智作普通会员1499元/月,可使用通用虚拟主播形象,每天可制作400分钟视频;智作尊享会员2999元/月,提供150次/天的导出次数和更高的制作额度。这种从“30元尝鲜”到“千元级专业版”的阶梯设计,让不同预算的用户都能找到适合自己的方案。
讯飞智作已广泛应用于新闻媒体、教育培训、金融、文旅、政务等多个行业。在新闻领域,它为媒体生成虚拟主播实现自动化播报;在教育领域,为教师定制数字分身辅助教学;在金融领域,智慧金融客服虚拟人已服务大量用户;在文旅场景,虚拟导游为游客提供沉浸式导览体验。截至2024年1月,平台已新增21万会员用户,生成160万条音视频内容。截至2025年,平台累计服务用户约1210万,聚集了约500万AI创作者。
当然,讯飞智作并非“输入关键词就自动赚钱”的神器。正如一位资深用户所言:“数字人只是一个工具,就像Word只能帮你打字,不能帮你写出诺贝尔文学奖。它能帮你省时间、帮你不用露脸出镜,但它不会自动帮你赚钱。如果你是想认真做内容、做推广的个人或小团队,讯飞智作绝对值得试;但如果你想找一个‘躺着赚钱’的工具,别浪费时间了。”说到底,讯飞智作的价值在于“提效”而非“代劳”——把制作视频的门槛从“专业剪辑师”拉低到“会用手机打字的人”,剩下的创意和内容质量,依然要靠你自己。
不论你是想为产品制作介绍视频的创业者、需要批量生产课程推广视频的教育机构、还是希望打造个人IP却不想出镜的内容创作者,这款由科大讯飞打造、依托星火大模型能力的一站式AIGC平台,都值得你花30块钱体验一下。毕竟,30块钱换一个“AI替你出镜”的能力,可能是2026年最划算的一笔投资。