实测|“360智脑”大升级后能图生图、文生视频、视频生文……看看你的工作是不是要被取代了
6月14日消息,360智脑推出了最新4.0版本,能力进行了大升级。
(资料图片仅供参考)
根据360集团创始人周鸿祎的介绍,自2023年3月29日以来,不到3个月的时间,360智脑从1.0迭代至4.0版本。
360智脑4.0具备跨模态生成能力,目前已经拥有文生文、文生图、文生表、图生图、图生文、视频生文、文生视频、文本剪视频能力。
最新的360智脑支持PC端/移动端使用,也就是说手机上也可以用了。而且支持语音输入能力,对于懒得打字/不会打字的人来说就很友好了。
支持语音输入
现场,周鸿祎还分别演示了360智脑的上述能力。有些是事先录好的视频,有些是现场直接演示。
目前360智脑4.0开放邀请测试,我们也会把能测试的功能进行试用,一起来看看360智脑目前达到什么水平了。
文生文能力,是ChatGPT为代表的大语言模型产品的代表能力,这也是360智脑最初版就有的能力。
文生图能力,在今年5月18日,360已正式发布了这项能力。
对这两项能力,在这里不多做叙述了。
直接进入360智脑4.0的几项新增跨模态生成能力看看。
1、图生图,应用场景有“生活照”秒变“证件照”
从现场播放的视频效果来看,可以把一张周鸿祎的生活照片,按需要及时生成为一张1寸红底证件照、2寸蓝底证件照等等。
用手机端360智脑,支持手机拍照后直接将手机拍图,生成想要尺寸的证件照。
这对PS无能人员来说简直是very good!
学生家长再也php不用担心老师临时要收集孩子证件照了!
不知道拍证件照的照相师傅是不是感受到了职业压力。
现在,360智脑已开放了该能力的体验,我们附上找到体验入口的方法,方便大家找到。
自己体验入口:360智脑首页-数字人广场-点击更多-找到“证件照设计师“,点击进入就可以开始了。
我们也实测了一下效果,头发的ps痕迹略生硬外,其他都很完美,主要是够快,输入图片后,10秒就出图了。解放PS手残党。
2、文生视频 应用场景包括根据文本剪视频
顾名思义,就是用户输入一段文字,360智脑输出一个视频。
这部分内容同样是视频展示。
从提供的视频中,用户输入“企鹅在沙漠中洗澡”文字,360智脑就给出了4个相关小视频。
这个对剪视频的小伙伴是不是很有帮助?视频剪辑师有没有感受到亿点点压力……
3、视频生文
从周鸿祎现场播放的视频来看,这个“视频生文”功能主要用在监测领域。
比如,在一段视频中,用户输入“帮我检测红色小汽车”,360智脑就会把视频中所有的红色小车都标记出来。
同样的,如果用户输入“帮我检测建筑工地yTumhkd上的建筑材料”,同样,在视频中的这些内容会被标记出来。
周鸿祎演示的这“文生视频”和“视频生文”这两项能力,我们在目前360智脑开放的功能中还没有找到入口。大家姑且看看上面的演示视频评估一下效果吧。
4、自定义“数字人”
这次,360还基于大模型发布新产品“360 AI数字人广场”,拥有200 虚拟数字人角色。
同时,360智脑支持数字人定制,可以根据你自己的需要创造出一个数字人。
目前,360智脑提供了马斯克、诸葛亮、孙悟空等多个现实/虚拟人物的数字人产品。
比如,你可以和诸葛亮聊聊“如果战国有智能手机,汝会如何利用”之类的消磨时光的话题。看看他如何用三国时代的语言回答你。
和“诸葛亮‘聊天
周鸿祎现场创建了自己的数字分身编程作为“360发言人”。他表示,数字分身拥有他本人完整的私人知识库,能够复刻他的思维方式和人生经历,是有“灵魂”的数字人。
和周鸿祎数字人聊买360股票能不能赚钱
因此,周鸿祎将360的数字人定位为做“有灵魂的数字人”。不过前提是,让数字人学习到足够丰富的关于真人的知识。
360智脑在多模态等关键能力上完成迭代,360全部产品都将接入该能力。
周鸿祎认为,当前国内各家企业AI大模型的基础能力相差不大,接下来行业真正比拼的是应用落地能力,要思考如何让个人和企业更方便、简单地使用AI大模型应用。
因此,360将重点关注的应用场景有四个方面:面向消费者的用户个人AI助理,中小微企业SaaS化垂直应用,面向大型企业、政府、城市的私有化部署大模型,以及面向行业的垂直大模型。
同时,周鸿祎也预告:下个月发布360智脑5.0php版本,该版本将发布插件平台。
今年以来,国内各大公司密集召javascript开各种大模型发布会,在周鸿祎看来,这三个月相当于人工智能行业过去的三十年。国内厂商追跑GPT-4的速度比他想象得要快。
从ChatGPT加速的这场AIGC变革,也许比大家想象的要来得更早。在人工智能发展的大潮中,很多职业都面临洗牌。
创新工场董事长开复就曾预言”未来十年,翻译、简单的新闻报道、保安、销售、客服等领域的人,将约有90%会被人工智能全部或部分取代。”
关键词: