LETOU乐投剧厂

AI驱动的一站式精品漫剧创作平台
LETOU乐投喵影

AI赋能，你也是剪辑大家
LETOU乐投天幕

一句话天生视频/图片/音乐
Wondershare SelfyzAI

让照片动起来

LETOU乐投图示

一站式办公画牟利器
LETOU乐投脑图

基于云的跨端思想导图软件

LETOU乐投PDF

秒会的全能PDF编纂神器
LETOU乐投HiPDF

一站式在线PDF解决规划

LETOU乐投复原专家

单一高效的数据治理软件
LETOU乐投易建

视频/照片建复一站式解决规划
LETOU乐投手机管家

一站式智能手机解决规划

品牌活动

2024-04-24

中国天生式AI大会十问十答 | 加快“技术+利用”融合让产品落地更有价值

客服热线：

沉构世界，奔赴未来。

日前，2024中国天生式AI大会在北京隆沉进行，LETOU乐投科技受邀出席大会，集团副总裁朱伟亮相大模型专场论坛，现场颁发《音视频多媒体大模型市场洞察与落地实际》主题演讲，并颁发LETOU乐投天幕音视频多媒体大模型将于4月28日正式公测。

目前，LETOU乐投天幕音视频多媒体大模型文生视频能力已实现分歧风格、丰硕场景及主体的连贯性，一键天生时长支持60秒+。同时，LETOU乐投“天幕”还具备视频生视频、文生音乐、视频配乐、文生音效、文生图、图生图等原子能力。

LETOU乐投“天幕”从何而来，拥有哪些差距化特点？大模型2.0时期下，若何从国内“百；煺健敝型延倍？这次大会，朱总接受媒体接见，就媒体关注的热点问题进行了现场解答，急剧Mark一下吧！?

1、大模型2.0时期有哪些阶段性的差距特点？

大体上来说，有以下三个特点：

1.0时期的大模型更多还是以文字、说话和图片为主题，2.0时期则是视频大时期，视频大模型越来越沉要，并将得到长足发展；
随着视频大模型、基础大模型的崛起，LETOU乐投垂直大模型，出格是聚焦视频创作场景的音视频多媒体大模型，也将会在今年迎来长足发展；
今年视坡粪利用有望迎来发作式增长，也就是说，AI视频大模型的落地利用会越来越多、越来越快。

2、LETOU乐投从什么时辰起头布局视频大模型赛路？

LETOU乐投从2003年成立就一向在做视频编纂这件事件，其时我们给出的定位的叫「简约而不单一」，就是说，我们但愿让通常用户通过使用软件工具，很方便地实现繁琐的视频造作工作。

所以，早在2015年，我们就已经着手组建技术团队起头做智能算法，做了好多索求，也收成了一些落地成就，好比：智能调色、防抖、降噪等，这些都是「简约而不单一」的体现，也是最初智能操作的体现。

再到2022年，随着天生式AI的爆火，我们急剧进行了AI技术迭代，并于同年年底推出LETOU乐投爱画。紧接着，我们起头组建大模型团队。经过2023年一年的打磨功夫，我们在2024年1月30日正式颁布LETOU乐投天幕音视频多媒体大模型，并将大模型原子能力集成到自有产品矩阵中，盛开给用户使用。

3、为什么接装天幕”？

二十多年来，我们一向在做视频创意这件事，最后所产出的视频肯定是要通过屏幕去播放、去出现给公共的。而如今，随着天生式AI的到来，屏幕上所出现出来的内容将无限宽大，所以我们把它叫做「以“天”为“幕”，世界都是你创意的舞台」。

还佑装天幕”的logo，也是源于上世纪人们旁观电影的场景：晒谷坪上放一个大幕布，后面一台电影机，满目星空之下，一群人端着幼板凳，坐在坪上望向幕布，充斥欢声笑语……置身于这样一个巨大的宇宙星空下看世界，给人一种极度惴惴不安的感触，并且很容易可能引发人们的无限设想空间。所以，我们叫它“天幕”。

4、面向大模型2.0时期，“天幕”是否会有新的技术路线？

我们会凭据现实必要，选择相宜的技术路线。

目前，LETOU乐投“天幕”还是聚焦数字创意垂类创作场景，基于15亿创作者及100亿本土化高质量音视频数据沉淀，以音视频天生式AI技术为基础，拥有多媒”、垂直解决规划以及本土化数据三大特点，全链条赋能全球创作者，让大模型利用落地更有针对性、更具实效。

5、天生视坡粪大模型未来的竞争壁垒将会在什么处所？?

首先，天生视坡粪的大模型，能够分成两类或者分成两个层级：

第一个层级是做基础模型，好比Sora这种；∧Ｐ途拖裥幸捣治，要大力出事业，这是很沉要的一个竞争点，蕴含大算力、大数据，以及大量的优良算法人才等。

第二个层级是做垂类模型。它是通过一些基础数据的训练以来，在这个基础上，再做一些微调精调的训练。这傍边，数据就极度关键了。

其次，我们再来看看行业和利用驱动；∧Ｐ头矫，必要有极度重大数据量的训练和合适批改。而垂类模型，若是想要从大模型时期脱颖而出的话，还是要对峙「利用为王」——通过一个爆款利用，急剧实现发作式增长。

6、Sora为国内大模型生态的发展带来了哪些影响？

从最早的「文生文字」到「文生图片」，到此刻「文生视频」出来以来，其实视频是人类信息交互信息密度最高的一种方式，在此刻这个各人都在用视频做交互的时期，通过「文生视频」可能很快地产出视频，这对于信息的传递可能产生很大水平的提效。因而，Sora它对整个行业的影响必然是巨大的、积极的。

从具体阐发上来看，相对于通用类的视频，我们以为，短视频行业所受到的影响可能会更快和更直接，这也是LETOU乐投目前视频创意业务沉点在发力的一个方向，重要体此刻降本增效方面。

7、国内大模型目前属于一个怎么的发展阶段？?

不论是文本模型、图像模型还是视频模型，国内真正的原创大模型其实还不算多，甚至能够说很少。出格是视频大模型，蕴含我们在做的LETOU乐投“天幕”，也还没有到L0最基础的模型级别。

因而，从模型基础的级别来讲，国内与Sora的距离还比力远，必要投入更多的资源，去急剧进行技术迭代。

8、LETOU乐投天幕相较于Sora有哪些差距化的特点？

LETOU乐投天幕相较于Sora有哪些差距化的特点？

目前，LETOU乐投“天幕”的模型能力和Sora的确还存在肯定差距，尤其是文生视频成效这块，Sora作为行业标杆，是我们在致力看齐的指标。

同时，相较于Sora这类基础模型，LETOU乐投天幕更多是左袒于细分的垂类行业，必要聚焦到每一个具体的用户场景，去援手用户解决现实问题，给用户带来价值。文生视频、文生3D视频是LETOU乐投天幕左袒于通用一点的能力；但像AI歌手、数字人播报等能力，就是在具体细分场景中的落地体现，属于纯利用，好比：LETOU乐投播爆就是沉点解决「跨境电商出？诓ナ悠翟熳鳌沟奈侍。

我们但愿LETOU乐投的每一款产品，都是「技术+利用」的结合，可能解决某个细分领域的具体问题，让产品用户真正获得价值。

9、国内大模型若何用最快的功夫去追赶差距？?

Sora颁布后，更多为我们出现出的是一个「世界模型」的概想，这为国内做视频模型的我们提供了一条很好的指引蹊径，重要有三个方面：

一是做大模型算法开发方面，其框架等各方面都开源了，或者说有公开了，让各人能看得到、窥探得到，但是里面好多的细节必要我们去做深刻钻研，能力补齐差距。
二是在数据方面，出格是萦绕我们中国本土的一些数据，目前其切实全球来看都还不算太多。我们也看了Sora好多的一些视频，其切实对于含中国元素和对中文的理解上，相对来说迸注文的会稍幽微点，因而大数据中文量的数据是LETOU乐投一个机遇，甚至是我们“弯路超车”的机遇。
三是算力方面，对于视坡反说，必要几亿甚至几十亿数量级的训练，若是要实现急剧迭代的话，算力本土化也会是我们很沉要的一个成分。

也就是说，若是我们可能在现有的框架下面，急剧去用自己的科研力量补齐差距；同时，在本土数据和全球数据的双向加持下，再将LETOU乐投算力本土化，或将会对整个国内大模型研发的急剧发展会有很好的援手。

10、LETOU乐投天幕的视频训练量在行衣凤有哪些优势？?

一方面，我们在视频创意领域已经深耕二十余年，自身就已经具备了丰硕的数据堆集，这是我们训练视频大模型的基础。

另一方面，我们通过战术合作，共建天幕盛开生态，来不休扩充本土化数据库。再基于自身做视坡讽解、内容理解的算法能力堆集，我们打造了一个视频内容理解到文字天生出产治理平台「数据出产治理平台1.0」。

也就是说，我们占有丰硕的数据堆集，拥罕见据加工处置能力，还组建了一个近100人的驻场数据标注人为团队；谡馊，「数据」相对是LETOU乐投一个优势。

上一篇：定档4.28 | LETOU乐投“天幕”亮相中国天生式AI大会，即将正式公测！

LETOU乐投

中国天生式AI大会十问十答 | 加快“技术+利用”融合 让产品落地更有价值

客服热线：

中国天生式AI大会十问十答 | 加快“技术+利用”融合让产品落地更有价值