字节跳动方面宣布,即将发布豆包视频生成模型

继此前在7月25日举行的“2024火山引擎AI创新巡展”成都站中,字节跳动方面带来豆包大模型的最新能力升级,并展示了该模型的“文生图”、“图生图”等特色能力后。


日前字节跳动方面宣布,将于9月24日举行的“2024火山引擎AI创新巡展”深圳站发布豆包视频生成模型,并带来更多豆包模型家族的能力升级。据悉在此次活动中,还将公布火山方舟、扣子专业版、HiAgent平台、AI全栈云等多款产品和云基础设施的最新进展,以及多个行业企业AI落地实践的分享。

字节跳动宣布将于9月24日发布豆包视频生成模型

据了解,字节跳动方面此前就已发布多个视频生成相关模型,例如AnimateDiff-Lightning、MagicVideo-V2等。


公开信息显示,此前在2024年5月举行的“火山引擎FORCE原动力大会”上,字节跳动方面正式发布自研的豆包(原名云雀)大模型,并宣布该系列模型将通过火山引擎对外提供服务,企业可根据自身业务场景需求灵活选择、快速落地。除了通用模型Pro外,豆包大模型还有通用模型Lite、角色扮演模型、语音合成模型、声音复刻模型、语音识别模型、文生图模型、Function call模型、向量化模型等多个版本。


值得一提的是,不久前有消息显示,字节跳动大力教育旗下AI教育App河马爱学已更名为豆包爱学,成为豆包旗下首个以豆包命名的App。同时有消息源透露,豆包或将尝试涉足体育、餐饮领域,推出豆包体育、豆包点餐等服务,以进一步丰富生态。对此有相关报道援引内部人士的消息称,“类似抖音打造抖音精选、抖音搜索、抖音商城等产品矩阵一样,字节跳动方面也开启了打造豆包系列产品的计划”。


此外在8月上旬,字节跳动旗下一站式AI创作平台即梦AI在苹果App Store及各大安卓应用商店上线。据悉,该平台可提供包括AI图片创作、视频创作等功能。其中,视频创作功能支持根据中文提示词进行创作,用户仅需输入简单的文案或图片,即可生成动效连贯、流畅自然的视频片段。同时该功能还引入了创新的首帧图片和尾帧图片输入方式,增强了视频生成的可控性。


在即梦AI上线不久后,字节跳动旗下AI智能助手豆包方面也宣布推出音乐生成功能。据悉,其提供了流行、摇滚、R&B、爵士、雷鬼、电音等11种音乐风格,可选择男声或女声演唱,并且所生成的声音在吐字清晰度和流畅性上表现良好。此外为了让AI音乐更好地贴合用户的情感表达,这一功能还预设有快乐、伤感等11种情绪状态。


近日有传言称,为了减少在AI训练和运行方面对英伟达GPU的依赖,字节跳动方面正计划与台积电合作,或在2026年大规模生产其所设计的两款芯片。对此字节跳动方面回应称,“报道不实,字节跳动在芯片领域确实有一些探索,但还处于初期阶段,主要是围绕推荐、广告等业务的成本优化,所有项目也完全符合相关的贸易管制规定”。


【本文图片来自网络】

踩(0)

最新文章

相关文章

大家都在看