LETOU乐投

索求LETOU乐投

客服热线:

4000-300624

品牌活动
2024-04-24

中国天生式AI大会十问十答 | 加快“技术+利用”融合 让产品落地更有价值

客服热线:

10Q10A-4

沉构世界 ,奔赴未来。

日前 ,2024中国天生式AI大会在北京隆沉进行 ,LETOU乐投科技受邀出席大会 ,集团副总裁朱伟亮相大模型专场论坛 ,现场颁发《音视频多媒体大模型市场洞察与落地实际》主题演讲 ,并颁发LETOU乐投天幕音视频多媒体大模型将于4月28日正式公测。

10Q10A-1

目前 ,LETOU乐投天幕音视频多媒体大模型文生视频能力已实现分歧风格、丰硕场景及主体的连贯性 ,一键天生时长支持60秒+。同时 ,LETOU乐投“天幕”还具备视频生视频、文生音乐、视频配乐、文生音效、文生图、图生图等原子能力。

10Q10A-2

LETOU乐投“天幕”从何而来 ,拥有哪些差距化特点?大模型2.0时期下 ,若何从国内“百;煺健敝型延倍?这次大会 ,朱总接受媒体接见 ,就媒体关注的热点问题进行了现场解答 ,急剧Mark一下吧!?

1、大模型2.0时期有哪些阶段性的差距特点?

大体上来说 ,有以下三个特点:

  • 1.0时期的大模型更多还是以文字、说话和图片为主题 ,2.0时期则是视频大时期 ,视频大模型越来越沉要 ,并将得到长足发展;

  • 随着视频大模型、基础大模型的崛起 ,LETOU乐投垂直大模型 ,出格是聚焦视频创作场景的音视频多媒体大模型 ,也将会在今年迎来长足发展;

  • 今年视坡粪利用有望迎来发作式增长 ,也就是说 ,AI视频大模型的落地利用会越来越多、越来越快。

2、LETOU乐投从什么时辰起头布局视频大模型赛路?

LETOU乐投从2003年成立就一向在做视频编纂这件事件 ,其时我们给出的定位的叫「简约而不单一」 ,就是说 ,我们但愿让通常用户通过使用软件工具 ,很方便地实现繁琐的视频造作工作。

所以 ,早在2015年 ,我们就已经着手组建技术团队起头做智能算法 ,做了好多索求 ,也收成了一些落地成就 ,好比:智能调色、防抖、降噪等 ,这些都是「简约而不单一」的体现 ,也是最初智能操作的体现。

再到2022年 ,随着天生式AI的爆火 ,我们急剧进行了AI技术迭代 ,并于同年年底推出LETOU乐投爱画。紧接着 ,我们起头组建大模型团队。经过2023年一年的打磨功夫 ,我们在2024年1月30日正式颁布LETOU乐投天幕音视频多媒体大模型 ,并将大模型原子能力集成到自有产品矩阵中 ,盛开给用户使用。

3、为什么接装天幕”?

二十多年来 ,我们一向在做视频创意这件事 ,最后所产出的视频肯定是要通过屏幕去播放、去出现给公共的。而如今 ,随着天生式AI的到来 ,屏幕上所出现出来的内容将无限宽大 ,所以我们把它叫做「以“天”为“幕” ,世界都是你创意的舞台」。

还佑装天幕”的logo ,也是源于上世纪人们旁观电影的场景:晒谷坪上放一个大幕布 ,后面一台电影机 ,满目星空之下 ,一群人端着幼板凳 ,坐在坪上望向幕布 ,充斥欢声笑语……置身于这样一个巨大的宇宙星空下看世界 ,人一种极度惴惴不安的感触 ,并且很容易可能引发人们的无限设想空间。所以 ,我们叫它“天幕”。

4、面向大模型2.0时期 ,“天幕”是否会有新的技术路线?

我们会凭据现实必要 ,选择相宜的技术路线。

目前 ,LETOU乐投“天幕”还是聚焦数字创意垂类创作场景 ,基于15亿创作者及100亿本土化高质量音视频数据沉淀 ,以音视频天生式AI技术为基础 ,拥有多媒”垂直解决规划以及本土化数据三大特点 ,全链条赋能全球创作者 ,让大模型利用落地更有针对性、更具实效。

5、天生视坡粪大模型未来的竞争壁垒将会在什么处所??

首先 ,天生视坡粪的大模型 ,能够分成两类或者分成两个层级:

第一个层级是做基础模型 ,好比Sora这种;∧P途拖裥幸捣治 ,要大力出事业 ,这是很沉要的一个竞争点 ,蕴含大算力、大数据 ,以及大量的优良算法人才等。

第二个层级是做垂类模型。它是通过一些基础数据的训练以来 ,在这个基础上 ,再做一些微调精调的训练。这傍边 ,数据就极度关键了。

其次 ,我们再来看看行业和利用驱动;∧P头矫 ,必要有极度重大数据量的训练和合适批改。而垂类模型 ,若是想要从大模型时期脱颖而出的话 ,还是要对峙「利用为王」——通过一个爆款利用 ,急剧实现发作式增长。

6、Sora为国内大模型生态的发展带来了哪些影响?

从最早的「文生文字」到「文生图片」 ,到此刻「文生视频」出来以来 ,其实视频是人类信息交互信息密度最高的一种方式 ,在此刻这个各人都在用视频做交互的时期 ,通过「文生视频」可能很快地产出视频 ,这对于信息的传递可能产生很大水平的提效。因而 ,Sora它对整个行业的影响必然是巨大的、积极的。

从具体阐发上来看 ,相对于通用类的视频 ,我们以为 ,短视频行业所受到的影响可能会更快和更直接 ,这也是LETOU乐投目前视频创意业务沉点在发力的一个方向 ,重要体此刻降本增效方面。

7、国内大模型目前属于一个怎么的发展阶段??

不论是文本模型、图像模型还是视频模型 ,国内真正的原创大模型其实还不算多 ,甚至能够说很少。出格是视频大模型 ,蕴含我们在做的LETOU乐投“天幕” ,也还没有到L0最基础的模型级别。

因而 ,从模型基础的级别来讲 ,国内与Sora的距离还比力远 ,必要投入更多的资源 ,去急剧进行技术迭代。

8、LETOU乐投天幕相较于Sora有哪些差距化的特点?

LETOU乐投天幕相较于Sora有哪些差距化的特点?

目前 ,LETOU乐投“天幕”的模型能力和Sora的确还存在肯定差距 ,尤其是文生视频成效这块 ,Sora作为行业标杆 ,是我们在致力看齐的指标。

同时 ,相较于Sora这类基础模型 ,LETOU乐投天幕更多是左袒于细分的垂类行业 ,必要聚焦到每一个具体的用户场景 ,去援手用户解决现实问题 ,给用户带来价值。文生视频、文生3D视频是LETOU乐投天幕左袒于通用一点的能力;但像AI歌手、数字人播报等能力 ,就是在具体细分场景中的落地体现 ,属于纯利用 ,好比:LETOU乐投播爆就是沉点解决「跨境电商出?诓ナ悠翟熳鳌沟奈侍。

我们但愿LETOU乐投的每一款产品 ,都是「技术+利用」的结合 ,可能解决某个细分领域的具体问题 ,让产品用户真正获得价值。

9、国内大模型若何用最快的功夫去追赶差距??

Sora颁布后 ,更多为我们出现出的是一个「世界模型」的概想 , 这为国内做视频模型的我们提供了一条很好的指引蹊径 ,重要有三个方面:

  • 一是做大模型算法开发方面 ,其框架等各方面都开源了 ,或者说有公开了 ,让各人能看得到、窥探得到 ,但是里面好多的细节必要我们去做深刻钻研 ,能力补齐差距。

  • 二是在数据方面 ,出格是萦绕我们中国本土的一些数据 ,目前其切实全球来看都还不算太多。我们也看了Sora好多的一些视频 ,其切实对于含中国元素和对中文的理解上 ,相对来说迸注文的会稍幽微点 ,因而大数据中文量的数据是LETOU乐投一个机遇 ,甚至是我们“弯路超车”的机遇。

  • 三是算力方面 ,对于视坡反说 ,必要几亿甚至几十亿数量级的训练 ,若是要实现急剧迭代的话 ,算力本土化也会是我们很沉要的一个成分。

也就是说 ,若是我们可能在现有的框架下面 ,急剧去用自己的科研力量补齐差距;同时 ,在本土数据和全球数据的双向加持下 ,再将LETOU乐投算力本土化 ,或将会对整个国内大模型研发的急剧发展会有很好的援手。

10、LETOU乐投天幕的视频训练量在行衣凤有哪些优势??

一方面 ,我们在视频创意领域已经深耕二十余年 ,自身就已经具备了丰硕的数据堆集 ,这是我们训练视频大模型的基础。

另一方面 ,我们通过战术合作 ,共建天幕盛开生态 ,来不休扩充本土化数据库。再基于自身做视坡讽解、内容理解的算法能力堆集 ,我们打造了一个视频内容理解到文字天生出产治理平台「数据出产治理平台1.0」。

也就是说 ,我们占有丰硕的数据堆集 ,拥罕见据加工处置能力 ,还组建了一个近100人的驻场数据标注人为团队;谡馊 ,「数据」相对是LETOU乐投一个优势。

10Q10A-3


【网站地图】